データとの新たな向き合い方

データ・グラビティとそれがデータ・ストレージ・インフラストラクチャに及ぼす影響

データ・グラビティはITインフラストラクチャ全体に影響を及ぼします。データ管理戦略を策定するにあたっては、主にこの点を考慮する必要があります。

目次

データ・グラビティ データ・グラビティ データ・グラビティ

データは今や、物的資本や知的財産と同様に、あらゆる業種の企業に不可欠な資産となりました。構造化データと非構造化データの量が増加の一途をたどる今、データ増大は今後数年のうちにかつてないペースで進むものと考えられます。その一方で、データの散在(企業データが一箇所にとどまらず、様々なデータセンターや地域に分散して管理される状態を指す)によって事態はより複雑化し、データの増大、移動、活用を管理することが困難になってきました。

企業は、クラウド、エッジおよびエンドポイント環境にある大量のデータを効率的に管理するための戦略を実行する必要があります。そして、大規模なデータ・ストレージ・インフラストラクチャを設計するにあたっては、十分な考慮をもとに戦略を策定することがかつてないほど重視されています。

テラバイト規模のデータに対応できる方法がペタバイト規模にも通用するとは限りません。大規模なデータの保存、移動、活用に伴う費用と複雑さを克服したいと考える企業には、より経済的で、スムーズかつシンプルなソリューションが必要です。つまり、シンプルかつオープンで制限がなく、データドリブンな分散型システムを持つ企業に適したソリューションです。データとの新たな向き合い方

データ・グラビティのコンセプトは、こうした取り組みを考えるうえで重要な要素です。

Seagate後援のIDCによる最新レポート「将来を見据えたストレージ:ハイブリッド、エッジ、およびクラウド・エコシステムのデータ増加に対応するインフラストラクチャのモダナイゼーション」によると、膨大なデータセットを抱えるストレージが拡大するにつれ、それがIT環境で他の要素にもたらす重力も増すとされています。

一般に、データ・グラビティはデータ量とその活用の程度に応じて生じます。この現象を説明する良い例が、物理学でいう「体重が重い人ほど、その周囲のものに対する引力も強くなる」という法則です。IDCレポートによると、「蓄積されるデータの量が増えるほど、その環境での質量が増し、アプリケーションやサービス、その他のインフラストラクチャ・リソースがデータに引き寄せられる」と言います。

大規模なアクティブ・データセットは、その複雑さと重要性ゆえに、関連する小規模なデータセットの保存場所と処理に影響を及ぼします。つまり、データ・グラビティはデータ・ライフサイクルの流れそのものを表しており、ITアーキテクチャについての意思決定に取り入れる必要があります。

次の2つのデータセットについて考えてみてください。ひとつは1ペタバイト、もうひとは1ギガバイトです。この2つのデータセットを統合する場合、小規模なデータセットを大規模なデータセットの保存場所に移動させるほうが効率的です。結果的に、1ペタバイトのデータセットを保存するストレージ・システムに1ギガバイトのデータセットも保存することになります。大規模なデータセットは他の小規模なデータセットを「引き寄せる」ことから、大規模なデータベースはデータをひとつに融合し、それによって全体的なデータ・グラビティがますます高まる傾向にあります。

また、データの管理、分析、活用はアプリケーションとサービスにも左右されます。そうしたアプリケーションやサービスの提供元がプライベート・クラウドやパブリック・クラウドのベンダーであれ、オンプレミスのデータ管理チームであれ、この傾向は変わりません。アプリケーションはデータを収集して生成するだけでなく、消費し、分析し、集約します。このように、データには多くの作業が付き物なのです。当然、データセットが増えていくほど、そのデータを活用することは困難を極めます。しかし、データの管理や活用に使用するアプリケーションやサービスの近くにデータを保存しておけば、こうした問題は起こりません。アプリケーションやサービスをデータセットの近くに移動させたり、データセットの近くに配置したりするのはそのためです。オンプレミスのデータセンターからパブリック・クラウドやエッジ・コンピューティングに至るまで、データ・グラビティはITインフラストラクチャ全体に広がる資産です。

しかしIDCレポートによると、そうした膨大なデータセットはまるでブラックホールのように「どこで運用していても、保存データやアプリケーション、サービスを一箇所に閉じ込め、IT環境が保存データ、さらにはそれに関連するアプリケーションやサービスの移行と管理に対応できる設計でない限り、捕えて離さない」といいます。

データ・グラビティはITインフラストラクチャ全体に影響を及ぼすことから、データ管理戦略を策定するにあたっては、主にこの点を考慮して設計する必要があります。IDCによると、データ・エコシステムを設計するにあたっての重要な目標は、「ITとアプリケーションのエコシステムがデータセットによって制御不能に陥らないようにすること」だとされます。

アプリケーションが常にデータにアクセスできる環境を整える

ITアーキテクチャ戦略では、大容量ストレージとデータ移動を中核に据える必要があります。これは、データの保存場所を最適化することから始まります。データ中心型のアーキテクチャでは、時間と費用をかけて集中管理型のサービス・プロバイダとの間で大量のデータを長距離転送するのではなく、アプリケーションやサービス、ユーザー・インタラクションをデータに近い場所に集めます。

IDCは「場所を問わず、アプリケーションのすぐ近くに保存データを配置することは、データ・グラビティの影響を軽減するひとつの方法である」と指摘しています。

このモデルは、データセンターのコロケーションを活用することで達成できます。これは、複数のプライベートおよびパブリック・クラウド・サービス・プロバイダを集約することで、企業がアプリケーション、コンピューティング、ネットワーキングのニーズに応じて、自社の大容量データ・ストレージを最善のソリューションと組み合わせることができるようにする方法です。

データ中心型アーキテクチャは、データアクセスを主な目標としています。データアクセスによってデータ・パイプラインの使いやすさと運用性が高まり、将来的なビジネス・イノベーションに影響を与えることができます。それにより、メタデータと新しいデータセットを生成する能力が改善され、データの検索と探索が可能になり、データ・サイエンティストがそうしたデータを機械学習とAIに効果的に活用できるようになります。

その一方で、データをITアーキテクチャの中心に配置することにも、アプリケーション性能の最適化、転送遅延の問題、アクセス料金や解約料金、セキュリティとコンプライアンスの必要性という点でメリットがあります。データの全体的な信頼性と耐久性も重要なメリットです。「信頼性」とは必要なときにデータにアクセスできること、「耐久性」とは長期にわたってデータを保管できることを指します。

IT戦略の中心にデータを

こうした考慮事項はいずれも、IT戦略全体の定義から事業戦略の策定に至るまで、企業のデータ管理計画に大きな影響を及ぼします。必要な作業負荷と役割についての計画を十分に練っておくことで、データ・グラビティを正確に把握することができます。明確にしておくべき点として、「どの程度のデータが生成され、消費されるか」、「データセンター、プライベート・クラウド、パブリック・クラウド、エッジ・デバイス、リモート・オフィス、ブランチ・オフィスに占めるデータの内訳はどの程度か」、「ITエコシステム全体でのデータの送信速度はどのくらいか」などがあります。こうした点に対処することで、データ・インフラストラクチャの効率性が高まり、高コストのデータ・パイプラインで生じる問題を緩和することができます。

IDCはレポートの中で「ひとつの作業負荷や運用場所だけにストレージやデータ・リソースの移動を任せてはいけない」と忠告しています。データには重力があるため、大量のデータセットや大規模な作業負荷によってストレージ・リソースに大きな重力がかからないよう、データ・インフラストラクチャを設計する必要があります。そこで活躍するのが、必要に応じてストレージ、コンピューティングまたはアプリケーション・リソースを効率良く移動するアーキテクチャです。

これにより、どのデータセットをどこに移動するか、最も効率良くデータを移動できるパスはどれか、そうした作業負荷を最も効果的に実行するにはどうすればいいのかを常に把握しておくことができます。また、データの移動を自動化することでストレージ費用を削減したり、すぐに必要でない低パフォーマンスのデータセットを移動したりすることも可能です。メタデータ管理の自動化も検討すべき方法のひとつです。これによりデータストア全体での検索と探索が可能になり、データにアクセスしやすくなります。

こうしたアイデアの実践は、適応性の高いデータ・アーキテクチャ、インフラストラクチャおよび管理プロセスを導入することにつながります。たとえ企業が今日のデータ・グラビティについてよく理解していても、5年後もそうであるとは言い切れません。

レポートの中でIDCは「まだすべての企業が膨大なデータセットをいくつも管理しているわけではないが、多くの企業はすでにそうしている。ビジネスのデジタル化のスピードと企業データやデータ収集の価値の高さを考えると、多くの組織が膨大なデータセットを管理することになるのは決して遠い未来の話ではない」と指摘しています。

重要なのは、すべてのデータ管理システムを新たなデータ要件に合わせて変更できるようにすることです。データ管理とそれを支えるデータ・アーキテクチャは柔軟でなければならず、変化するビジネスニーズと技術面での新たなチャンスに適応できる能力を備えておくことが必要です。

Seagate後援のIDCによる最新レポート「将Future-proofing Storage: Modernizing Infrastructure for Data Growth Across Hybrid, Edge and Cloud Ecosystems」でハイブリッド・アーキテクチャ、ネットワークの制約の克服、ストレージ管理の複雑化についての詳細をご覧ください。