ホワイト・ペーパー

データ・センターのAIを強化する高度なストレージ・アーキテクチャ。

seagate-supermicro-osnexus

AIの未来のために構築されたSupermicro、Seagate、OSNexusの共同ソリューションは、AIの効率性と拡張性の両方を向上させるように設計されています。

分(読取り)

seagate-supermicro-osnexus

目次:

    エグゼクティブ・サマリー。

    人工知能 (AI) の台頭により、拡張性が高く、ハイパフォーマンスで、コスト効率に優れたデータ・センター・ストレージ・ソリューションに対する需要がかつてないほど高まっています。このホワイト・ペーパーでは、Supermicroハードウェア、SeagateのHAMRベースMozaic 3+™テクノロジーが実現するSeagate Exosハードディスク・ドライブ、OSNexus QuantaStorソフトウェアを組み合わせた包括的なソリューションを紹介します。この共同ソリューションは、AI主導のデータ・ストレージに対するニーズの爆発的な増加に対応し、スケールアップ構成とスケールアウト構成の両方をサポートする堅牢なアーキテクチャを提供します。主な利点には、AIワークロードの増大に対応する拡張性の強化、高スループットと低レイテンシーを両立する卓越したパフォーマンス、物理ドライブの削減と省電力によるコスト効率の最適化、運用を簡素化する統合管理プラットフォーム、コンプライアンスを実現する高度なセキュリティ機能、エネルギー効率の高いストレージ・ソリューションによる環境への影響の低減が含まれます。

    概要。

    AIおよび機械学習 (ML) テクノロジーの急速な進化は、データ・ストレージを取り巻く環境を一変させました。計算能力の向上、開発者のアクセス民主化、開発ツールの高速化により、AI主導のイノベーションが爆発的に増加しています。AIモデルの高度化に伴い、拡張性に優れた高性能ストレージ・ソリューションの必要性はかつてないほど高まっています。データはAIのバックボーンであり、膨大な量のデータを効率的に保存、管理し、それらにアクセスする能力は、AIモデルのトレーニングやAIアプリケーションのデプロイに不可欠です。従来のストレージ・ソリューションでは、こうした要求に応えられないことが多く、AIワークロードのニーズに合わせた新しいアーキテクチャの開発が必要になっています。

    AIワークロードの進化に伴い、ストレージ・ソリューションの進化も必要となっています。

    AIワークロードは、従来のストレージ・ソリューションでは対応しきれない新たな課題をもたらします。AIモデルのトレーニングには膨大なデータが必要で、その量はペタバイト規模に達することも珍しくありません。トレーニング・プロセスの効率は高速のデータ検索に大きく依存するため、データにすぐにアクセスできる必要があります。さらに、AIアプリケーションでは、リアルタイムのインサイトを提供するために、高スループットと低レイテンシーが要求される大規模なデータ処理タスクが頻繁に実行されます。

    また、AIワークロードは大量の計算を伴うために大量のメタデータが生成され、ボトルネックを防ぐためそれらを効率的に管理する必要があります。拡張性やパフォーマンスに限界がある従来のストレージ・ソリューションでは、これらのニーズに応えることができません。これらのソリューションの多くは、動的なワークロードを処理する柔軟性に欠けるため、効率性の低下と運用コストの増加につながります。

    AI主導のイノベーションには、迅速に拡張でき、大量の非構造化データを処理でき、これらのデータへのシームレスなアクセスを提供できるストレージ・ソリューションが必要です。たとえば、複雑なAIモデルをトレーニングするには、膨大なデータ・セットを繰り返し処理してアルゴリズムを改良し、精度を向上させる必要があります。このような反復処理に必要とされる大量のデータは、従来のストレージ・システムでは対応できないため、遅延を発生させ、AIオペレーションの全体的な効率を低下させる可能性があります。

    さらに、AIアプリケーションは、即時のデータ処理が重要とされるリアルタイム環境でのデプロイが増加しています。これには、自律走行車、予知保全、個別化医療などの用途が含まれます。このような使用例では、大容量だけでなく、瞬時のデータ分析と意思決定をサポートする卓越したパフォーマンスを実現するストレージ・ソリューションが必要です。

    スケールアップ構成とスケールアウト構成をサポートします。

    Supermicro、Seagate、OSNexusの共同ソリューションは、最先端のハードウェアとソフトウェアを組み合わせることで、堅牢性、拡張性、コスト効率に優れたAIワークロード向けのストレージ・インフラストラクチャを実現します。このソリューションのコア・コンポーネントには、SupermicroサーバーおよびJBOD、Seagate Mozaic 3+ハードディスク・ドライブ、Seagate Nytro NVMe SSD、OSNexus QuantaStorソフトウェアが含まれます。

    共同ソリューションのアーキテクチャは、スケールアップ構成とスケールアウト構成の両方をサポートしており、デプロイの多様なニーズに対応できます。

    スケールアップ(垂直スケーリング)では、CPU、メモリ、ストレージ・ドライブなどのリソースを追加して、単一のストレージ・システムやサーバーの容量を増やします。このアプローチは個々のユニットのパフォーマンスを最大化しますが、拡張性に本質的な限界があります。

    一方、スケールアウト(水平スケーリング)では、システムにストレージ・ノードやサーバーを追加して、ワークロードを複数のユニットに分散させます。このアプローチでは、拡張性がほぼ無制限になり、需要の増大に応じてアーキテクチャをシームレスに拡張することで、より大きく、複雑なAIワークロードを処理できます。

    スケールアップ構成は、小規模なコスト重視の用途に最適で、最大5~10GB/秒のスループットを実現します。対照的に、スケールアウト構成はより大規模なデプロイ向けで、ノードの追加に応じて直線的なパフォーマンス拡張が行われます。この拡張性により、ソリューションは毎秒数百ギガバイトのスループットを実現し、集中的なAIワークロードの要求を満たすことができます。

    Supermicroサーバー、Seagateドライブ、QuantaStorソフトウェアのシームレスな統合により、一貫性のある効率的なストレージ・ソリューションが形成されます。このアーキテクチャはファイル・ストレージとオブジェクト・ストレージの両方をサポートしており、組織はそれぞれのニーズに最適な構成を柔軟に選択できます。QuantaStorが提供する統合管理により、すべてのコンポーネントが調和して動作し、パフォーマンスと信頼性を最適化します。単一のプラットフォーム内でスケールアップとスケールアウトの両方の構成を管理できるため、運用が簡素化され、複数のストレージ・システムのメンテナンスに伴う複雑さが軽減されます。

    アーキテクチャの概要。

    このアーキテクチャは、Supermicroサーバー、Seagate Exos Mozaic 3+ハードディスク・ドライブ、Seagate Nytro NVMe SSDで構成され、そのすべてがOSNexus QuantaStorソフトウェアによって管理されています。この組み合わせは、高スループット、低レイテンシー、および膨大なデータ・セットを効率的に処理する能力を必要とするAI/MLワークロードの厳しい要求に応えます。

    デプロイ・インフラストラクチャに関する考慮事項。

    • ネットワーキングの詳細と、成功に必要な最低限のインフラストラクチャは、本ホワイト・ペーパーの範囲外ですが、アーキテクチャの意思決定においては非常に重要な要素です。
    • 重要な基準:
      • ネットワーク速度(最適なメディアとノード・サイズを決定)
      • ラックの仕様(ラックの奥行きとUスペース)
      • 電力と冷却の予算

     

    スケールアップとスケールアウトのアーキテクチャ。

     

    • スケールアップ・アーキテクチャ
      • このアーキテクチャは、コスト効率に優れた高密度ストレージを必要とする環境に最適です。デュアルポートNVMeドライブをSupermicroの24ベイ・シャーシに搭載し、基盤となるドライブへの共有アクセスを可能にすることで、ハイパフォーマンス/高可用性を実現します。このアーキテクチャはJBODによる拡張をサポートしており、最大4台のJBODをスケールアップ・コントローラーに接続できるため、Mozaic 3+のエンタープライズクラスのハードディスク・ドライブを搭載した最大7ペタバイトのストレージを含む構成をサポートします。
      • スケールアップ構成では、QuantaStorでOpenZFSが利用されます。OpenZFSは、特に大規模ストレージ環境において、高度なデータ保護、拡張性、効率性で知られるエンタープライズレベルの高性能ファイル・システムで、効率的なデータ保全性チェックとストレージの最適化を可能にします。このアーキテクチャは、特に小規模なAI/MLワークロードや、コストの最小化と密度の最大化が優先される環境に適しています。
    機能の説明が記載された製品画像。

    拡張

     

    • スケールアウト・アーキテクチャ
      • スケールアウト・アーキテクチャは、ノードを追加することで直線的なパフォーマンス拡張性を実現するように設計されています。イレイジャー・コーディングとノード間の複製技術を使用して、高可用性とデータ冗長性を確保します。このアーキテクチャは、パフォーマンスと容量のニーズが高まり続けている大規模なAI/MLワークロードに特に適しています。たとえば、GPT (Generative Pre-trained Transformer) やBERT (Bidirectional Encoder Representations from Transformers) のような大規模言語モデル (LLM) のトレーニングには、膨大な計算能力とデータ・ストレージが必要であり、高まる複雑さと増大するデータ量を管理するためにはスケールアウト・アーキテクチャが不可欠です。また、変異解析や遺伝子発現研究などのタスクでゲノム・データの大規模な処理が必要なAI主導のゲノム研究も、スケールアウト・アーキテクチャが実現する拡張性と高可用性によって大きなメリットを得られます。
      • このアーキテクチャでは、(NVMeとハードディスク・ドライブが混在する)ハイブリッド・ノードとオールフラッシュ・ノードを組み合わせることができるため、特定のパフォーマンス要件と容量要件に基づいてクラスタを柔軟に構成できます。スケールアウト構成において、QuantaStorでは、多数のノードにわたる分散ストレージの提供に優れたCephテクノロジーとの統合が活用されています。

    主な考慮事項と設計オプション。

    AI/MLワークロードの具体的なパフォーマンス要件やデータ容量のニーズによっては、最適な結果を得るために異なる構成が必要になる場合があります。処理されるデータ量やデータへのアクセス速度などの要因によって、ハイブリッド構成とオールフラッシュ構成のどちらがシナリオに最適かが左右されます。また、予算や拡張性の要件も、アーキテクチャの設計選択に影響します。

    • ハイブリッド構成。
      • ハイブリッド構成では、NVMe SSDと大容量ハードディスク・ドライブを組み合わせて使用することで、パフォーマンスとコストのバランスを取ることができます。このアーキテクチャは、JBODで最大60台または90台のドライブをサポートするため、医学や物理学の研究など、ペタバイト規模のハイパフォーマンスと大容量が要求されるAI/MLワークロードに適しています。
      • 標準的なスケールアップ・ハイブリッド・プールでは、メタデータと小さなファイルのオフロード用のプールあたり3台のNVMeドライブと、より大きなデータ・セットを保存するための大容量のハードディスク・ドライブを組み合わせて使用することがあります。スケールアウト・ハイブリッド構成では、ノードあたり3台以上のNVMeドライブが使用されます。
    • オールフラッシュ構成
      • オールフラッシュ構成は、リアルタイム分析や集中的なデータ処理タスクなど、とりわけハイパフォーマンスを要求されるAI/MLワークロードで推奨されます。
      • これらのスケールアウト構成では、スケールアウト・クラスタで数百台のNVMeドライブを活用することで、最大1TB/秒のスループットを実現できます。
    • 容量とパフォーマンスの考慮事項
      • ストレージ容量とパフォーマンス要件のバランスを取ることが不可欠です。たとえば、フラッシュ・ドライブとハードディスク・ドライブが混在するスケールアウト・ハイブリッド・クラスタでは、パフォーマンスを最適化するために、ストレージ全体の約3%がフラッシュになる可能性があります。一方、スケールアップ・ハイブリッド・クラスタでは、フラッシュ・ストレージが全体の1%程度になる可能性があります。エンタープライズSSDは価格が6倍であり、テラバイトあたりのコストとTCOではハードディスク・ドライブが明らかに優位であるため、データ・センターの大容量ストレージでは依然として好まれる選択肢となっています。
      • このアーキテクチャでは、小規模なクラスタから始めた後、必要に応じてノードやJBODを追加してクラスタを拡張できるため、ストレージ・インフラストラクチャをAI/MLワークロードに応じて拡大できます。

    管理と最適化。

    ストレージ・アーキテクチャ内でのAI/MLワークロードのパフォーマンスを最大化するには、効果的な管理と最適化が不可欠です。QuantaStorの高度な管理機能は運用を効率化し、多様な構成で包括的な制御と監視を実現します。

    • QuantaStorの統合管理
      • QuantaStorは、スケールアップとスケールアウトの両方のアーキテクチャの管理を簡素化する統合コントロール・プレーンを提供します。自動階層化、エンドツーエンドの暗号化、業界標準への準拠などの高度な機能をサポートし、ストレージ・インフラストラクチャの安全性とAI/MLワークロードへの最適化を保証します。
      • ソフトウェアのグリッド・テクノロジーにより、複数のサイトにまたがるストレージのシームレスな拡張が可能になり、異種システムの管理に伴う複雑さが解消されます。

    使用例とシナリオ。

    さまざまなAI/MLワークロードに応じて、パフォーマンスとコスト効率を最適化するために、カスタマイズされたストレージ・ソリューションが必要です。ワークロードの規模や複雑さに応じて、スケールアップ構成、スケールアウト構成、混合構成のいずれかをデプロイし、さまざまな業界や用途に固有の要求を満たすことができます。

    • スケールアップの使用例
      • スケールアップ構成は、AI/MLワークロードが小さい環境や、コスト効率を優先する環境に最適です。メディアおよびエンターテインメント業界のストレージ、サーバー仮想化、データ・アーカイブなどの用途に最適です。
    • スケールアウトの使用例
      • スケールアウト構成は、パフォーマンスと容量の両方を拡張できることが重要なハイパフォーマンス・コンピューティング、データ・レイク、AI/ML環境向けに設計されています。これらの構成は、大規模なオブジェクト・ストレージやリアルタイム分析にも最適です。
    • 混合の使用例
      • 組織は、同じ環境内でスケールアップとスケールアウトの両方の構成をデプロイし、QuantaStorの統合管理を使用して、さまざまなワークロードで一貫性を維持し、パフォーマンスを最適化できます。

    whitepaper-joint-ai-supermicro-figure-4

    拡張

    技術の進歩。

    このソリューションに組み込まれた技術的進歩は、ソリューションの有効性を実現するために大きな役割を果たしています。Seagate Exos Mozaic 3+ハードディスク・ドライブは、ストレージ技術の飛躍的な進歩を象徴しています。HAMRテクノロジーを活用することで、これらのドライブはこれまでにない記録密度を達成し、同じ物理的フットプリント内でより大きなストレージ容量を実現しています。この進歩は、大容量データ・ストレージに対するニーズを満たすだけでなく、同じ容量のデータを保存するのに必要なドライブの数が少なくて済むため、エネルギー効率も向上させます。

    Mozaic 3+ハードディスク・ドライブのTCO上のメリットは非常に大きく、同じデータ・センター・フットプリントでストレージ容量が3倍になり、1テラバイトあたりのコストが25%、消費電力が60%、エンボディド・カーボンが70%削減されます(現在のデータ・センターでアップグレードが必要な一般的なドライブ容量である10TBのPMRドライブとの比較)。ドライブの消費電力削減はエネルギー・コストの低減に、密度の上昇は必要な物理的スペースの縮小につながり、データ・センター・インフラストラクチャが削減されます。また、エンボディド・カーボンの削減により、このドライブは現代の企業にとって重要性が増しているサステナビリティ目標に沿った、より環境に優しい選択肢となっています。

    Seagate Nytro NVMe SSDを統合することで、パフォーマンスが一層強化されます。これらの高速ドライブは、AIワークロードに付き物の集中的な読取り/書込み操作を管理するために不可欠です。レイテンシーが低いため、AIモデルのトレーニングやAIアプリケーションのデプロイに不可欠なリアルタイムのデータ・アクセスとデータ処理が可能になります。SSDは、デュアルポート設計により片方のポートが故障した場合でも動作が継続するため、信頼性を向上させます。

    OSNexus QuantaStorソフトウェアは、インテリジェントなデータ管理と高度なセキュリティ機能を提供することで、ソリューションをさらに強化します。ソフトウェアの自動階層化機能により、データは最適な階層に保存され、パフォーマンスとコストの両方が最適化されます。エンドツーエンドの暗号化と業界標準への準拠は、特に機密データが頻繁に扱われる医療や金融のような業界において、AIアプリケーションで最も重要なセキュリティとプライバシーの懸念に対処することでデータを保護するために役立ちます。

    whitepaper-joint-ai-supermicro-figure-6

    拡張

     

    ソリューションの利点。

    Supermicro、Seagate、OSNexusの共同ソリューションには、AI/MLワークロード特有のニーズを満たすいくつかの主な利点があります。これらの利点には以下が含まれます。

    • 拡張性:このソリューションはスケールアップとスケールアウトが可能であるため、AIワークロードの需要の増加とともに拡張できます。数テラバイトから数ペタバイトのデータを扱う組織でも、ストレージ・インフラストラクチャを全面的に見直すことなく、このソリューションでニーズに対応できます。
    • パフォーマンス:Seagate Nytro NVMe SSDおよびMozaic 3+ハードディスク・ドライブを使用し、QuantaStorの管理機能と組み合わせることで、卓越したパフォーマンスを実現できます。これは、効率的に機能するために高スループットと低レイテンシーが要求されるAI/MLワークロードでは特に重要です。
    • コスト効率:このソリューションのアーキテクチャは、資本的支出と営業費用の両方を最適化するように設計されています。必要な物理ドライブ数の削減、消費電力の低減、柔軟な統合管理プラットフォームの提供により、このソリューションは総所有コスト (TCO) を大幅に削減します。
    • 統合管理:QuantaStorは、1つのインターフェイスでスケールアップとスケールアウトの両方のアーキテクチャを管理できるため、運用を簡素化し、マルチベンダーのストレージ・ソリューションに伴う複雑さを軽減します。この統合アプローチは、時間の節約だけでなく、エラーの可能性の低減と全体の効率化にもつながります。
    • セキュリティとコンプライアンス:このソリューションには、不正アクセスからデータを保護し、業界標準への準拠を保証する高度なセキュリティ機能が含まれています。これは、データ侵害が重大な法的、金銭的処罰につながりかねない規制業界のAIアプリケーションでは特に重要です。
    • 環境への影響:Mozaic 3+プラットフォーム上に構築されたSeagateドライブを使用すると、消費電力が減り、ストレージに必要な物理的スペースが削減されるため、データ・センターの環境への影響が低減されます。これは、テクノロジー・セクターにおけるサステナビリティの重要性の高まりとも合致しています。

    使用例と用途。

    このソリューションは、さまざまな業界の幅広い使用例をサポートするのに十分な汎用性を備えています。以下に例をいくつか示します。

    • 医療:予測分析や個別化医療など、ヘルスケアのAI/MLワークロードは、膨大な量のデータを迅速かつ安全に処理する能力を必要とします。この共同ソリューションは、これらの用途をサポートするために必要な拡張性、パフォーマンス、セキュリティを実現します。
    • 金融:金融業界では、AIは不正検知、アルゴリズム取引、リスク管理などのタスクに使用されています。これらの用途では、高速データ処理とリアルタイム分析が必要ですが、これらはどちらもソリューションのハイパフォーマンス・ストレージ・アーキテクチャによってサポートされます。
    • メディアおよびエンターテインメント:メディアおよびエンターテインメント業界では、特に高画質動画の使用増加に伴い、膨大な量のデータが生成されています。大規模なデータ・ストレージを処理し、ファイルへの高速アクセスを提供するこのソリューションは、動画の編集、レンダリング、アーカイブなどのタスクに最適です。
    • 製造:製造業界では、AI/MLは予知保全、品質管理、サプライ・チェーンの最適化に使用されています。これらの用途では、効率的な保存と分析が必要な大量のデータが生成されます。この共同ソリューションは、これらの使用例をサポートするために必要な拡張性とパフォーマンスを実現します。
    • 研究開発:医薬品、ゲノミクス、材料科学、気候モデリングなどの分野におけるAI主導の研究では、大規模なデータセットを保存および処理する能力が必要とされます。高スループット、低レイテンシーのこのソリューションは、要求の厳しいこれらの用途に適しています。

    結論。

    Supermicro、Seagate、OSNexusが共同開発したこのAIソリューションは、AI/MLワークロード特有の要求に合わせてカスタマイズされた、包括的で拡張性に優れ、コスト効率の高いストレージ・アーキテクチャを提供します。ハードウェアとソフトウェアの高度な技術を組み合わせることで、このソリューションは卓越したパフォーマンス、信頼性、効率性を実現し、AIを活用した競争力向上を目指す組織にとって理想的な選択肢となります。ヘルスケア、金融、メディア、製造、研究など、デプロイされる分野にかかわらず、このソリューションは次世代のAIアプリケーションをサポートするために必要とされる堅牢なインフラを提供し、業界の枠を超えてAI主導のイノベーションの未来を切り開きます。 

    ソリューション表。

    トポロジ製品レジリエンシー・モデル未加工容量使用可能容量詳細仕様
    スケールアップSBBハイブリッドトリプルパリティ2039TB(未加工容量)1512TB使用可能リンク
    スケールアップSBBオールフラッシュダブルパリティ (4d+2p)737TB(未加工容量)553TB使用可能リンク
    スケールアウトハイパー・オールフラッシュEC2k+2m/REP31106TB(未加工容量)533TB使用可能リンク
    スケールアウト4U/36EC4K+2m/REP33974TB(未加工容量)2513TB使用可能リンク
    スケールアウト4U/36EC8K+3m/REP38342TB(未加工容量)5786TB使用可能リンク
    スケールアウトデュアルノード・トップ・ローディングEC8K+3m/REP311981TB(未加工容量)8406TB使用可能リンク


    略語と追加情報。

    SBB:ストレージ・ブリッジ・ベイ。
    EC:消去コーディング。
    「ダブルパリティ」と「トリプルパリティ」は、データ冗長性とフォールト・トレランスを実現するために使用されるパリティ・ブロックの数を指します。
    数値列はレジリエンシー・モデルに関連します。