PR

 プリファード・ネットワークス(PFN)は、深層学習(Deep Learning)向けの専用SoC(System on Chip)「MN-Core」とそれを実装したアクセラレーターボードを開発し、開催中の半導体関連の展示会「SEMICON Japan 2018」に参考出展した(PFNの関連ページ)。2020年春ごろの実用化を想定する。

MN-Coreに用いたダイとそのウエハー
[画像のクリックで拡大表示]
MN-Coreに用いたダイとそのウエハー

演算性能はGoogleの1.5倍、Huaweiの2倍超

 MN-Coreは、深層学習向け行列演算器(MAU)1個とプロセッサーエレメント4個を1ブロック(Matrix Arithmetic Block:MAB)として、そのMABを512ブロック集積したダイを4個、ファンアウト型パッケージで1つのSoCにパッケージ化したもの。チップ1個は、台湾TSMCの12nm世代プロセスを採用しながら32.2mm×23.5mmと巨大。それを4個用いて作製したSoCは85mm角とさらに巨大である。

MN-Coreのチップレイアウト
[画像のクリックで拡大表示]
MN-Coreのチップレイアウト
チップ1個には、行列演算器(MAU)1個とPE4個からなるブロック(MAB)を512個集積している。(図:PFNのWebページより)

ダイを4個、1パッケージにしたSoC「MN-Core」
[画像のクリックで拡大表示]
ダイを4個、1パッケージにしたSoC「MN-Core」
寸法は85mm×85mm。ダイに刻印されている「GRAPE」は、このチップの設計などを主導した神戸大学 教授の牧野淳一郎氏が手掛けてきた重力多体問題専用ICのシリーズ名

 演算性能は倍精度(64ビット)の浮動小数点演算で32.8TFLOPS、単精度(32ビット)では131TFLOPS、半精度(16ビット)では524TFLOPS。2018年5月に米グーグル(Google)が開発中であることを明らかにした同様な専用SoC「TPU version 3」が半精度で360TFLOPS、同年10月に中国ファーウエイテクノロジーズ(Huawei Technologies)が発表した専用SoCが、TSMC 7nm世代という最先端プロセスを使って半精度で256TFLOPSであることと比べても、演算性能の高さが目立つ。

独自ヒートシンクで500Wの熱に対処

 1W当たりの演算性能も半精度で約1TFLOPS/Wと、上記の競合メーカーと肩を並べる。ただ、演算性能自体が高いことで消費電力は500Wと小型電気ストーブ並みに大きい。この熱対策として、PFNはヒートシンクを独自開発し、アクセラレーターボードに実装した。ちなみに、GoogleはTPU version 3で液体冷却システムを採用する方針だ。

MN-Coreを搭載したアクセラレーターボード「MN-Core Board」
[画像のクリックで拡大表示]
MN-Coreを搭載したアクセラレーターボード「MN-Core Board」
MN-Coreの周囲にあるICは、DRAM。計32Gバイト分だという。

 PFNは2017年に、米エヌビディア(NVIDIA)のグラフィックス処理プロセッサー(GPU)をアクセラレーターとして用いた「プライベート・スーパーコンピューター『MN-1』」を開発。2017年11月のスーパーコンピューターのランキング「TOP 500」で、世界91位(国内13位、産業領域では世界12位)の性能を示した。次いで、その次世代版となるMN-2も開発中だとする。

この記事は有料会員限定です

日経クロステック有料会員になると…

専門雑誌8誌の記事が読み放題
注目テーマのデジタルムックが読める
雑誌PDFを月100pダウンロード

有料会員と登録会員の違い