AI 聚焦

AI 依赖于大容量数据存储。

存储和激活海量数据对于下一波 AI 创新至关重要。

释放 AI 的潜能需要取得平衡。

应用开发人员正在竞相训练和部署 AI 模型。重点是要找到合适的数据并提升算力。随着 AI 模型和应用的激增，弄清如何存储生成的海量 EB 数据已成为一项紧迫挑战。支持 AI 工作负载需要在 AI 数据工作流中结合重要的内存和存储技术。而最终大规模部署 AI 需要硬盘的加持。

为 AI 提供学习、创建以及改进所需的数据离不开广泛的存储技术。从高吞吐量内存到高容量硬盘，要针对任何 AI 工作负载找到合适的存储方案，都关系到平衡对性能、成本和可扩展性的需求。

AI 计算集群会训练、运行以及优化语言模型。GPU、CPU、NPU 和 TPU 与高性能存储设备紧密耦合，为极端计算提供每秒 TB 甚至 PB 的吞吐量。而使用和创建的输入和输出数据会流到网络存储集群中，数据会长期保存在这里，而且主要保存在机械硬盘上，进而支持未来的再训练、质量控制和合规性。

如今这些先进的 AI 创新者还运营着全球超大规模云数据中心。这些组织选择将其 90% 的 EB 级在线数据¹存储在机械硬盘上，因为深知机械硬盘在大容量存储方面独具性价比优势。尽管 SSD 也是一项关键技术，但随着针对 AI 优化的架构部署越来越多，机械硬盘将持续存储大部分数据。

AI 时代的数据爆炸需要可扩展的大容量存储。虽然固态硬盘 (SSD) 对于低延迟工作负载很重要，大规模 AI 部署还是离不开机械硬盘。这背后有三个关键因素。

规模经济效益

按每 TB 成本计算，SSD 的购置成本是机械硬盘的 6 倍，因此后者成为 AI 数据存储扩建的理想选择²。

EB 级大规模生产

如果按资本支出衡量，机械硬盘的制造效益比 NAND 行业高出 9 倍³。

大规模可持续发展

与 SSD 相比，机械硬盘的运行能耗低 4 倍，隐含碳低 10 倍⁴。

通过支持整个人工智能数据工作流，硬盘在验证人工智能模型中发挥着至关重要的作用。

阅读博文

释放 AI 的全部潜能需要数据以及存储技术的加持。

硬盘通过保存透明、可追踪的训练里程碑来支持 AI 可靠性。

磁密度、成本效率和可持续性方面的突破推动 AI 可扩展性。

硬盘和 SSD 将与 GPU、CPU、HBM 和 DRAM 一起成为人工智能应用的重要组件。

Seagate 分析，基于 IDC Multi-Client Study，《Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers》，2023 年 11 月.
Seagate 分析，基于《Forward Insights Q323 SSD Insights》，2023 年 8 月；《IDC Worldwide Hard Disk Drive Forecast 2022-2027》，2023 年 4 月，文档#US50568323；TRENDFOCUS SDAS 长期预测，2023 年 8 月。
使用 5 年生命周期的总隐含碳。
Sara McAllister 等人，《A Call for Research on Storage Emissions》，Hotcarbon.org，2024 年。