全2128文字
PR

 米NVIDIA社は2020年5月、新しいGPU「A100」を発表した(図1)。「Ampere」と呼ぶ新しいアーキテクチャーを採用し、ディープラーニングでの学習時や推論時の処理性能を高めた。同社の「Volta」世代の従来GPUに比べて20倍の性能を備えるとする。

(a)「A100」
(a)「A100」
[画像のクリックで拡大表示]
(b)TF32と他のフォーマットの比較
(b)TF32と他のフォーマットの比較
[画像のクリックで拡大表示]
(c)TF32と他のフォーマットの比較
(c)TF32と他のフォーマットの比較
[画像のクリックで拡大表示]
図1 「TF32」で312TFLOPS
NVIDIA社は、新しいGPU「A100」を発表した(a)。第3世代のディープラーニング用の演算コアを搭載。深層学習用の浮動小数点フォーマットである「TF(Tensor Float)32」と「bfloat16」の2つに対応する(b)。TF32は、FP32並みのダイナミックレンジとFP16並みの精度を備える。演算処理性能は、TF32による学習で最大312TFLOPS、INT8(8ビット整数演算)による推論で最大1248TOPSに達する(c)。(写真:(a)はNVIDIA社)