AIブームで勢いに乗る半導体メーカーのNVIDIAは、Spectrum-Xというネットワーキングプラットフォームも提供しています。これは世界初のAI向けネットワーキングプラットフォームであり、世界中で導入が進みつつある状況です。本記事では、Spectrum-Xの概要や求められる背景、特徴などをまとめて解説します。
Spectrum-Xは2023年5月に発表され、同年11月に提供開始されました。これは生成AIワークロード(タスク)をターゲットにした新しいイーサネットベースのネットワークプラットフォームであり、AI向けに特化したイーサネット製品としては世界初です。NVIDIAによると、Spectrum-XはAI、機械学習、自然言語処理、さらには多様な業界アプリケーションに最高のパフォーマンスを提供するといいます。
Spectrum-Xは当初、Dell Technologies、Hewlett Packard Enterprise、Lenovo、SuperMicroなどがパートナーとなり、提供開始されました。2024年現在ではパートナー数が増えており、各社が自社製品に組み込んだりしながら、幅広いユーザーに提供されています。
昨今注目を集めている生成AIの多くは、イーサネットネットワークをベースとしたクラウドシステムとして提供されています。具体的には、データセンターに設置されたGPUサーバーを複数台接続してクラスタ(群れ)を構成し、並列分散処理によってAIの計算を行うというものです。しかし、従来のイーサネット技術では生成AIなどに求められる膨大な数のワークロードを処理するのには十分といえず、特定のサーバーでの遅延やパケットロスによって全体の処理が大きく遅れてしまう可能性がありました。
NVIDIAはAI向けのチップで世界一のメーカーですが、AI時代への移行をさらに加速させるべく、チップ以外のインフラ製品も幅広く開発・提供しています。そこで、上述した課題を解決でき、大規模な生成AIの計算を担える技術として、Spectrum-Xが開発されました。
Spectrum-Xは主に「NVIDIA Spectrum-4」というイーサネットスイッチと「NVIDIA BlueField-3」というDPU(データプロセッシングユニット)で構成されています。
「Spectrum-4」は、AIネットワーク専用に構築された世界初の51テラビット/秒イーサネットスイッチであり、ネットワークの混雑を最小限に抑えつつ、大規模かつ負荷の高い処理能力を実現した製品です。また、「NVIDIA BlueField-3」はGPU サーバー間で最大400ギガバイト/秒のRoCE(RDMA over Converged Ethernet)ネットワーク接続を実現し、クラスタ内におけるAIの学習および処理性能を向上させています。
NVIDIAはこれらの製品と技術を組み合わせたSpectrum-Xによって、AIクラウドシステムのパフォーマンスを1.7倍に高め、AIワークロードの処理・分析・実行の高速化に成功しました。
そのほかにも、Spectrum-Xには次のようなメリットがあります。
●標準のイーサネット技術に準拠しており、完全な互換性を持っている
●パフォーマンスの向上によってエネルギー効率が高まり、消費電力を抑えられる
●AIクラウドシステム内で実行されているトラフィック(通信量)を可視化し、ボトルネックを特定できる
当初のSpectrum-Xは限られたパートナーを通じて提供されていましたが、パートナー数は少しずつ増えています。日本においては、GMOインターネットグループが2024年12月にリリース予定の生成AI向けGPUクラウドサービスにSpectrum-Xを採用したことを発表していますが、これは国内クラウド事業者としては初めての取り組みです。Spectrum-Xが広がり、生成AIなどの開発力や利便性がさらに向上すれば、AI時代への移行がますます加速していくでしょう。