コンピュテーショナル ストレージによるデータ中心型コンピューティングの台頭   コンピュテーショナル ストレージ:データ ストレージから、自らデータを認識して適切に処理を行うデータ中心型コンピューティングへの進化形

当資料は、2022年5月16日に公開されたブログの抄訳版です。
ブログ原稿 https://www.dell.com/en-us/blog/rise-of-data-centric-computing-with-computational-storage/
筆者 Gaurav Chawla

「コンピュテーショナル ストレージ(Computational Storage)」は、データ中心型コンピューティングにおける次の進化の形で、データおよびコンピュートのローカル性を最適化しながら、スケールメリットを高めるものです。コンピュテーショナル ストレージでは、データをアプリケーションが動作するホストに移動させるのではなく、データの保存場所に近づけることで効率化が期待できます 。それによってホストのCPUとメモリーが解放され、顧客のアプリケーションに集中することができます。データの処理はストレージに任せることで、I/Oトラフィックが減少し、ネットワークの負荷が軽減されます。そしてデータの移動を抑えることでセキュリティーが向上します。また、持続可能性で言えば、データセンター全体的な二酸化炭素排出量の削減が期待でき、環境にもメリットをもたらしてくれます。

データ中心型のコンピューティングへの進化は、過去10年間の「コンピュート アクセラレーション(Compute Acceleration)」から始まりました。コンピュート アクセラレーションでは、アプリケーションの高速化とAI(人工知能)/ML(機械学習)に焦点が当てられ、業界的にはGPU、ASIC、AI/MLフレームワーク、AI対応アプリケーションなどが注目されるようになりました。GPU/ASICは、現在ではAI/MLのユースケースに幅広く利用されています。そしてデータ中心型コンピューティングの第2フェーズでは、ネットワークとストレージの高速化に焦点が当てられました。ここでは、まずFPGAおよびSmartNICが注目され、2年間でDPU(データ処理ユニット)とIPU(インフラストラクチャー処理ユニット)の進化がありました。

これによって、データセンターのハードウェア インフラストラクチャーとソフトウェア サービスを分離できるようになり、論理的に構成可能なシステムと、最適化したデータフローが可能になりました。DPU/IPUはクラウドで幅広く使われていますが、エンタープライズ環境でも採用され始めています。データ中心型コンピューティングの進化における次の段階は、「データの高速化」で、これを実現するための最も重要なテクノロジーがコンピュテーショナル ストレージとなります。

コンピュテーショナル ストレージの技術は、半導体の多様性と分散コンピューティングを活用して、データ処理をデータの近くで行うことに重点が置かれます。現在の「データ ストレージ」システムを未来の「データ認識型」システムへ進化させ、データ発見、処理、変換、分析をより効率的に行えるようになります。今後数年のうちに、コンピュテーショナル ストレージは、AI/ML向けのGPU/ASICやネットワークおよびストレージ処理向けのDPU/IPUと同等のレベルの成熟度に達し、業界での採用も増加するでしょう。

CSD(コンピュテーショナル ストレージ ドライブ)、CSP(コンピュテーショナル ストレージ プロセッサー)、DPUによって、データ処理をストレージに近いところで行い、データセンター環境全体の経済性が良くなります。アプリケーション固有の処理、および将来のイノベーションに向けたソフトウェア プログラミング可能な要素を提供するFPGA(フィールド プログラマブル ゲートアレイ)も、重要な役割を果たします。これらをCSDおよびCSPに統合することで、アプリケーション固有の処理を高速化します。

この2年間、スタートアップ企業、システム ベンダー、ソリューション ベンダー、クラウド サービス プロバイダーなど、コンピュテーショナル ストレージの実現に向けた動きが活発化しています。ここで課題となっているのが、コンピュテーショナル ストレージ インターフェイスとアプリケーションの統合、またストレージ デバイスとプラットフォームの可用性です。
NVM ExpressおよびSNIAでは、ブロック ストレージのアーキテクチャー モデルとコマンドセットを標準化するための複数の標準化作業が進行中です。コンピュテーショナル ストレージ向けのSNIAアーキテクチャーには、CSD、CSP、CSA(コンピュテーショナル ストレージ アレイ)が含まれています。一般的にCSAには、基盤となっているCSD / CSPを発見、管理、利用するためのCSD、CSP、ソフトウェアが含まれています。統合ソリューションは、CSAの一例です。ほとんどのアプリケーションは、ファイルやオブジェクトを使ってデータにアクセスまたは保存するので、標準化やオープンソースの取り組みは特にオブジェクトやファイルのプロトコルにてすると考えられます。

データ処理を行う場所は、アプリケーション レベルのデータ コンテキストがあるポイント、またはこのようなコンテキストが生成されるポイントとなりますので、ファイルやオブジェクト ストレージ向けのコンピュテーショナル インターフェイスも今後登場するでしょう。また一歩踏み出して、アプリケーション固有の処理をデータに近い場所で行い、結果のみをアプリケーションに送るということも可能となります。ソフトウェア定義データベースやデータレイクアーキテクチャとの統合により、データレイクの上で動作するユーザーアプリケーションの透過性を高め、ソリューションのパフォーマンスと経済性を向上させることができます。

エッジ コンピューティング増えるのに伴い、データが生成される場所にてアプリケーション固有の処理をコンピュテーション ストレージにて実行することも増えてきました。コンピュテーションをメモリー内のデータに移動させる隣接テクノロジーの1つとして、コンピュテーショナル メモリーも登場しています。これにより、永続メモリー ファブリックでのコンピュテーションが将来的に可能となります。HBM(広帯域メモリー)は、GPUだけでなく、ストレージ プラットフォームのデータ変換エンジンにとっても、興味深いものになることでしょう。

データの運用は、固定された機能とプログラミング可能な機能の両方に対応するようになります。 モダン ストレージ システムは、コンテナ化したマイクロ サービスに基づくソフトウェア 定義アーキテクチャーにて構築されます。これにより、アプリケーション固有の計算を、水平方向に拡張可能なストレージ上、あるいはコンピュテーション ストレージのディスクドライブやメモリー上で、安全なマイクロサービスの形で実行する機会が生まれます。
将来のデータベースやデータレイクアーキテクチャでは、より効率的なデータ処理、データ発見、分類のために、コンピュテーショナルストレージのコンセプトが生かされることになるでしょう。コンピュテーショナル ストレージに関する昨年時点での展望については、「Computational Storage in Data Decade」をご覧ください。以下は、Data DecadeにおけるComputational Storageに関する昨年の見解です。

デル・テクノロジーズは、コンピュテーショナル ストレージのさまざまなテクノロジーをさらに進化させながら、統合ソリューションをお客様に提供するために、複数の業界標準化団体およびパートナー各社と協業しています。2022年、仮想統合データ処理向けのアーキテクチャーはさらに進化し、データ中心型コンピューティングの次の進化への道が開かれるでしょう。

現在のデータ ストレージは、将来徐々にデータ認識型へ進化するでしょう。データ認識型ストレージでは、さまざまなポリシーに基づいてデータの発見、分類、変換を自動で行うことができるようになり、企業は、デジタル ファーストな組織からデータ ファーストな組織への進化を遂げることができます。アプリケーション固有のデータ処理が、よりデータに近い場所で行われ、データセンターおよびエッジ クラウド アーキテクチャー全体が最適化されます。2022年後半から2023年にかけて、今後のストレージ業界の進展にご期待ください。