全1896文字

HPCプラットフォーム強化の新製品が3つ

 NVIDIAは、HPC(High Performance Computing)の国際オンラインイベント「ISC High Performance 2021 Digital」に合わせての発表も行った ニュースリリース 。こちらでは、「NVIDIA HGX AI スーパーコンピューティング」と呼ぶプラットフォーム向けの新製品を発表した。このプラットフォームは同社のGPUやネットワーク製品、さらにAIやHPC向けのソフトウエアスタックなどからなる。今回、このプラットフォーム向けに、GPUとInfiniBandスイッチ、ストレージ向けソフトウエアの新製品を1つずつ、合計3つを発表した。

 GPUの新製品は「A100 80GB PCIe」である。20年11月に発表したGPU「A100 80GB」*3と同様に、合計80GバイトのHBM2eを搭載したA100のGPUカードだが、フォームファクターが異なる。A100 80GBはSMXだったが、今回のA100 80GB PCIeはPCI Expressカードである。

関連記事 *3 NVIDIAが新GPU「A100」にDRAM倍増の80Gバイト版を追加
合計80GバイトのHBMを搭載したGPU「A100 80GB PCIe」
合計80GバイトのHBMを搭載したGPU「A100 80GB PCIe」
(出所:NVIDIA)

 InfiniBandスイッチの新製品は、「Quantum-2 スイッチ」である。20年11月に発表の400Gビット/秒対応の「NDR 400Gb/s InfiniBand」アーキテクチャーを採るスイッチで ニュースリリース 、今回、具体的な製品が登場した。Quantum-2 スイッチには、同社の既存のInfiniBand製品(HDR 200Gb/s InfiniBandアーキテクチャーのQuantumスイッチ)と同様に、固定式とモジュラー式がある。固定式の「Quantum-2 QM9700シリーズ」は物理的に32ポートを備え、実使用時には64ポートの400Gビット/秒のInfiniBandスイッチとなる。既存の固定式Quantumスイッチ製品の3倍のポート密度を実現したという。

固定式の「Quantum-2 QM9700シリーズ」
固定式の「Quantum-2 QM9700シリーズ」
物理的に32ポートを備え、実使用時には64ポートの400Gビット/秒のInfiniBandスイッチとなる。(出所:NVIDIA)
[画像のクリックで拡大表示]

 モジュラー式の「Quantum-2 CS9500シリーズ」は、実使用時に512~2048ポートの400Gビット/秒のInfiniBandスイッチ構成が採れる。2048ポートの最大構成時の双方向スループットは1.64Peta(ペタ)ビット/秒で、モジュラー式のQuantumスイッチ製品の5倍になるという。また、最大構成時には、「DragonFly+」と呼ぶネットワークトポロジーのおかげで、3ホップで100万を超えるノード接続が可能だとする。Quantum-2スイッチは21年中にサンプル版を提供開始予定。

モジュラー式のQuantum-2の最大構成(右端)では、実使用時には2048ポートの400Gビット/秒のInfiniBandスイッチとなる
モジュラー式のQuantum-2の最大構成(右端)では、実使用時には2048ポートの400Gビット/秒のInfiniBandスイッチとなる
(出所:NVIDIA)
[画像のクリックで拡大表示]

 ストレージ向けソフトウエアの新製品は「Magnum IO GPUDirect Storage」である。このソフトウエアを使うことで、CPUを介さずにGPUのメモリーとストレージ間のダイレクトアクセスが可能になる。これにより、アプリケーションのI/Oレイテンシーが短縮され、ネットワークアダプターの全帯域幅を使用できるようになると同時に、CPUの使用率が軽減されるという。Magnum IO GPUDirect Storageは現在、提供可能である。

「Magnum IO GPUDirect Storage」ソフトウエアの効果
「Magnum IO GPUDirect Storage」ソフトウエアの効果
左端はこのソフトウエアを使わない場合でCPUの介入が必要。中央と右端はこのソフトウエアを使う場合で、CPUの介入なしでGPUメモリーとストレージ間でアクセスが可能である。(出所:NVIDIA)
[画像のクリックで拡大表示]