全2622文字
PR

 米NVIDIA(エヌビディア)は2022年9月19~21日(現地時間)にオンライン開催のプライベートイベント「NVIDIA GTC 2022」において、基調講演に登壇したCEOのJensen Huang氏が新たなGPUアーキテクチャー「Ada Lovelace」と同アーキテクチャーを採るGPU製品を複数発表した 基調講演要約の公式ブログ 。Ada LovelaceベースのGPU製品で最も力を入れて紹介したのは、デスクトップPC向けGPUカード「GeForce RTX 40シリーズ」である(図1)。同シリーズのハイエンド品「RTX4090」は、1つ前のGPUアーキテクチャー「Ampere」を採る「GeForce RTX 30シリーズ」のハイエンド品「RTX 3090 Ti」*1より最大で4倍の高速処理が可能だとする ニュースリリース

図1 「GeForce RTX 40シリーズ」のハイエンド品「RTX4090」を紹介するJensen Huang氏
図1 「GeForce RTX 40シリーズ」のハイエンド品「RTX4090」を紹介するJensen Huang氏
(画像:NVIDIA)
[画像のクリックで拡大表示]

 Ada Lovelaceには、以下の(1)~(6)をはじめとした複数の特徴がある(図2)。(1)新たなストリーミングマルチプロセッサー(SM:Streaming Multiprocessor)を搭載する。これにより、RTX4090ではシェーダー性能が最大83TFLOPとなり、前世代品の最大40TFLOPSの2倍以上になった。なお、Ada LovelaceのSMは、128個のCUDAコアと、1つのRTコア、4つのTensorコアからなる。(2)第4世代Tensor コア(深層学習向け演算回路)を搭載する。第4世代Tensorコアは2022年3月発表のデータセンター向けGPGPU「H100」に最初に搭載され*2、今回、複数の製品に展開した。RTX4090では、第4世代TensorコアがサポートするFP8演算によって、最大テンサー性能が1.32PFLOPSになった。これは前世代品の5倍の性能という。

図2 GeForce RTX 40のGPU IC(左)とAda Lovelaceアーキテクチャーの特徴
図2 GeForce RTX 40のGPU IC(左)とAda Lovelaceアーキテクチャーの特徴
(画像:NVIDIA)
[画像のクリックで拡大表示]

 (3)第3世代RTコア(レイトレーシング向け演算回路)を搭載する。これによりRTX4090の実行レイトレーシング性能は最大191TFLOPSになり、前世代品の2.8倍に向上したという。(4)SER(Shader Execution Reordering:シェーディング処理の再スケジューリングで実行効率を向上)機能を備える。SERによってレイトレーシング性能が最大3倍に向上するという。(5)DLSS 3(第3世代DLSS:DLSSは深層学習を使った超解像機能)を備える。DLSS 3では第4世代Tensorコアと新たなオプティカル・フロー・アクセラレーターを使うことで、35以上のゲームやアプリケーションにおいてフレームレートを最大で4倍に向上できるという ニュースリリース (6)第8世代のNVENC(NVIDIA Encoder)を搭載する。これによって、AV1のエンコードが可能になった。前世代品では、AV1のデコードは可能だったが、エンコードはできなかった。