AIに適したデータ・ストレージ
AIイノベーションの次の波には、大量のデータを保存し、有効活用することが非常に重要です。
アプリケーション開発者たちは、AIモデルのトレーニングと展開にしのぎを削っており、彼らが特に重視しているのは、適切なデータを見つけ、コンピューティング性能を増強することです。一方で、AIモデルやアプリケーションが急増するなか、どうすれば、それらが生成する大量のエクサバイト・データを保存できるかが緊急課題となっています。AIワークロードに対応するには、AIデータ・ワークフロー全体で、重要なメモリおよびストレージ技術を組み合わせる必要があります。しかし結局のところ、AIのスケールアップには、ハードディスク・ドライブが必要です。
学習、創造、改善に必要なデータをAIに与えるには、さまざまなストレージ技術が必要です。高スループットのメモリから大容量のハードディスク・ドライブに至るさまざまなストレージを組み合わせてあらゆるAIワークロードに適合させるには、パフォーマンス、コスト、および拡張性に対するニーズのバランスを取ることが重要です。
AIコンピューティング・クラスタが、言語モデルの訓練、実行、最適化を可能にします。また、GPU、CPU、NPU、TPUと高性能メモリ・デバイスの緊密な連携が、テラバイト、さらにはペタバイト/秒のスループットを実現し、並外れた計算性能を発揮します。こうした技術を使用し生成した入出力データは、ネットワーク・ストレージ・クラスタに向かい、主にハードディスク・ドライブに長期保存されます。その後、将来の再トレーニング、品質管理、コンプライアンス確保に利用されます。
今日の最先端AIイノベーターは、世界最大のハイパースケール・データ・センターやクラウド・データ・センターも運営しています。こうした企業は、オンライン・エクサバイト¹の90%をハードディスク・ドライブにあえて保存していますが、これは、大容量ストレージであるハードディスク・ドライブにしかない、価格対性能の価値が認められていることを意味します。SSDも重要な技術ではありますが、AIに最適化されたアーキテクチャの導入が進み、これからもデータの大半がハードディスク・ドライブに保存されることになるでしょう。
ハードディスク・ドライブは、AIデータ・ワークフロー全体をサポートすることにより、AIモデルの検証において重要な役割を果たしています。
AIの可能性を最大限に引き出すには、データとそれを支えるストレージが必要です。
AIが普及し、大量のデータが生成されるにつれ、人や機械は、これまで以上に速いペースでさまざまな創造を行うようになるでしょう。
AIは、データを消費し、新しいコンテンツを生成し、自分のパフォーマンスから学習するという好循環のフィードバック・ループをたどり、能力を高めます。
Seagateでは、ストレージをAIに最適化しています。これによって、ストレージ容量を前例のない規模で拡大し、データ・センターのアーキテクチャと構築を効率的に行えるよう注力しています。
以下の文書に基づくSeagateの分析、IDC『 Multi-Client Study, Cloud Infrastructure Index 2023: Compute and Storage Consumption by 100 Service Providers』(2023年11月)
以下の文書に基づくSeagateの分析、Forward Insights『Q323 SSD Insights』(2023年8月)、IDC『Worldwide Hard Disk Drive Forecast 2022-2027』(2023年4月、文書文書番号US50568323)、TRENDFOCUS『SDAS Long-Term Forecast』(2023年8月)
5間年のライフサイクルで見たエンボディド・カーボンを使用。
McAllister, S.氏らによる『A Call for Research on Storage Emissions』、Hotcarbon.org、2024年。