案例研究

数据层解决方案

气候研究院通过 Seagate 解决海量数据问题。

Seagate 可扩展解决方案帮助气候研究院平安度过不断增长的数据风暴。

中央研究院是台湾一家非常重要的气候研究所。该研究所的研究员预测,未来四年,数据量将增长 16 倍,总量超过 10PB。随着用于模拟的数据的扩展,该团队需要紧跟发展的可靠数据存储。Seagate 通用可扩展的解决方案能够满足他们不断增长的需求。

可靠且可扩展的海量数据解决方案

Seagate 支持气候研究院的数据密集型建模工作

到 2050 年实现净零碳排放是需要全球付出努力的一项迫在眉睫的行动。为响应这一目标,台湾正在积极推动气候变化相关的立法,并重组其环保部门,以作为实现净零碳排放目标的举措。为参与这项行动,台湾最重要的研究院中央研究院的环境变迁中心 (RCEC) 的气候团队通过开展相关气候研究,开发了台湾地球系统模型 (TaiESM)。

TaiESM 参与了由世界气候研究计划 (WCRP) 资助的第六阶段耦合模式比较项目 (CIMP6),联合国政府间气候变化专门委员会 (IPCC)/工作组一 (WGI) 第六次评估报告 (AR6) 曾引用过该模型 。TaiESM 的模拟数据通过 Seagate 存储系统支持的数据门户分享给各个国家/地区的不同研究机构。目前,RCEC 的气候团队与许多学术团队合作,包括国立台湾大学海洋研究所 (IONTU),以持续改进 TaiESM 中的物理和化学过程。

创建贴合本地需求的独立模型。

目标

TaiESM 的第一阶段使该气候团队成功地参与了国际数据交流,甚至使该团队在大多数模型性能评估中名列前茅。最新版本的 TaiESM 是基于美国社区地球系统模型 (CESM) 构建的。人为气候变迁中心 CEO 许晃雄表示:“开发我们自己的模型包括了我们自身独特的特征、规格、技术和成功。我们的下一个阶段是优化第一版 TaiESM,目标是由台湾团队开发完全独立的气候预测模块,从核心程序到内部模块,贴近本地需要,并真正地专属于台湾。”

除了基本模型开发,改进 TaiESM 还需要收集由其他国际气象单位生成的气候模拟数据,以用于 TaiESM 比较和分析。该团队的另一个目标是通过国际协作,产生和传播长期可信的天气预测和数据可用性,以提高国际知名度。这种影响力会提高他们在台湾以及全球的声誉和知名度,从而增加国际合作和数据交流的机会。

 

未来四年,数据存储需要将增加 10PB。

当前问题

TaiESM 气候团队在不久的将来需要近 10PB 的数据存储来维持更高的建模数据需求。现有的存储可用性比率和有限的服务器空间无法再满足他们的应用和工作负载要求。数据交换的频率提高以及数据收集的改进意味着该团队需要始终有效的可用性、速度和改进的数据保护。

在追求 TaiESM 的第二阶段时,环境变迁研究中心需要更多的数据存储容量,以满足更强大的数据分析和更高分辨率的可视化要求,同时应对由数据增长和数据分散导致的复杂的结构化数据激增。

现有的存储设备空间、性能和可用性比率无法再满足该团队的应用和工作负载需求。为了使存储设备能够满足未来需要并对其进行扩展,使其能够存储更多研究数据和分析报告,存储设备需要立即扩展。

研究中心的数据增长已经远远超过一家普通研究机构的容量。气候变迁研究中心的当前研究数据容量预计已经达到 3PB。该中心预计在未来四年,气候数据量将至少再增长 10PB。气候团队每天模拟至少 2-4 TB 的数据,他们的需求是无缝气候数据交换,而不是孤立的数据。

同时,他们迫切需要改进建模的分辨率。当前版本的 TaiESM 提供的分辨率达不到研究的理想水平。为了准确模拟地形和天气条件(如台风),该团队希望将水平分辨率提高至少四倍。将分辨率提高四倍意味着数据量至少增长到 16 倍。

而要在气候研究实验室中更逼真地重现天气条件,该团队的需求变得更具挑战性。一个主要障碍要是随着温度从陆地到海洋的变化模拟天气条件的长期平均值。技术的进步提高了存储驱动器的容量和计算精度,使得可以使用更多的网格或地球分区,从而改进了模型预测。处理更多数据会带来更多资源机会,但处理也会产生更多数据。

为了追求高达 25 千米的视觉分辨率,该团队每天产生 32TB 到 64TB 的数据。中央研究院的气候团队必须不断调整和校准模块设置,并比较每种不同模块设置产生的数据,而这会进一步产生数据。有效可靠的数据存储对于该团队至关重要。硬盘故障曾经是他们的一大痛点,每个月需要花费大量成本更换 4 到 10 个故障硬盘。

 

Seagate 提供快速、可靠、经济高效的数据访问。

解决方案

对于该气候研究团队而言,几乎没有冷数据。中央研究院需要永久性存储解决方案来存放所有气候数据。预测、分析、加工预测和分析以及多模型数据通过使用分布式文件系统的专用数据服务器提供。

随着数据量的急剧增长,团队必须仔细考虑数据存储容量、存储效率、存储性能以及一些不明显的因素,如硬件占地面积和相关的物理设施需求。

Seagate 的高密度数据存储系统 Exos X Series 5U84 在气候团队研究的现阶段实现了 7GB 和 5.5GB 的顺序读取和写入性能。Seagate 的超密集智能解决方案也超出了团队预期,将数据中心机架空间缩减了 75%,将总拥有成本降低了 80%。Seagate 分布式自动保护技术 (ADAPT) 也帮助团队将硬盘故障的存储重建时间缩短了 93%。

气候研究团队依靠 Seagate 的通用架构部署高容量、高性能平台,解决了急剧数据增长问题,并通过实时数据分层选项高效地管理热数据和冷数据。Seagate 解决方案使中央研究院能够扩展存储,获得数据访问自由,同时简化运营和优化成本。

 

密集型解决方案可降低成本并提高性能

成功故事

更短的停机时间以及更低的维护成本和 IT 成本帮助 TaiESM 专注于改进气候预测,并在不牺牲性能的情况下妥善管理数据。

Exos X 5U84 具有“五个九”的可用性 (99.999%),帮助中央研究院一致地交付高可靠性。最大密度 5U 机箱容纳 84 块硬盘,可以扩展到 336 块硬盘,实现高达 8 PB 的存储空间。机箱经过精心调整,可防止振动和声学干扰、热量和电源异常,最大限度地提高硬盘性能。借助 ADAPT,可将气候研究数据分散到所有硬盘,提供高级数据保护,在不牺牲性能的情况下提供快速重建,缩短停机时间。停机时间缩短意味着产品寿命延长,并降低了维修或更换所花费的 IT 费用。

更短的停机时间和更低的 IT 成本使得 TaiESM 能够专注于优化其气候预测模型。总之,Exos X Series 5U84 帮助气候团队高效管理海量数据,减少存储设备的高额维护费用,使该团队能够贡献任务关键型气候学模型,造福不断壮大的国际社区。

使用的产品

大容量,低延迟

Seagate 超密集型 Exos X 5U84,可实现容量、可用性、通用性和性能的最大化。

想要了解更多?

我们的存储专家乐于帮助您找到应对数据挑战的适合解决方案。