PR

 米グーグル(Google)が開発したディープラーニング(深層学習)専用プロセッサの第3世代「TPU 3.0」は、ラック8台で構成するポッドでスーパーコンピュータ「京」(ラック864台)の10倍となる「100ペタFlops」を実現するモンスターチップだ。

 グーグルは2018年5月8~10日にシリコンバレーで開催した開発者会議「Google I/O 2018」でTPU 3.0を発表。TPU 3.0の実物展示に加え、TPUシリーズを解説する技術セッションなどを実施した。

 現時点でグーグルはTPU 3.0について、「ポッド当たりの性能が100ペタFlops」であり、「第2世代のCloud TPUに比べて8倍の性能」であることしか明らかにしていない。ただ、TPU 3.0の実物をCloud TPUと比較すると、もう少し詳しい内容をうかがい知れる。

ラックへの収納台数は2倍に

 TPU 3.0はCloud TPUと同様、1台のボードにプロセッサを4個搭載。冷却方式として初めて「液冷」を採用した。ボード上に空冷用の巨大ヒートシンクを搭載していたCloud TPUに比べて、ボードの高さは半分以下だ。展示会場の説明員によれば、ラック1台に収納できるボード数はCloud TPUの2倍になるという。

液冷を採用したTPU 3.0
液冷を採用したTPU 3.0
[画像のクリックで拡大表示]
空冷を採用した前バージョンのCloud TPU
空冷を採用した前バージョンのCloud TPU
[画像のクリックで拡大表示]

ポッド当たりのラックの規模も2倍

 第2世代のCloud TPUはボード当たりの演算回数が180テラFlopsで、64個のCloud TPUボードからなるポッドの性能が11.5ペタFlopsだった。Cloud TPUのポッドはサーバーラック4台に64個のCloud TPUボードを格納していた。

 それに対してTPU 3.0のポッドは8台のラックで構成する。前述のようにTPU 3.0はCloud TPUに比べて2倍のボードを1ラックに収納できることから、TPU 3.0のポッドはCloud TPUの4倍、256個のボードを搭載することになる。

歴代のTPUハードウエア。下がTPU 3.0のポッド
歴代のTPUハードウエア。下がTPU 3.0のポッド
[画像のクリックで拡大表示]

この記事は有料会員限定です

日経クロステック有料会員になると…

専門雑誌8誌の記事が読み放題
注目テーマのデジタルムックが読める
雑誌PDFを月100pダウンロード

有料会員と登録会員の違い