PR

 英Arm社は、プロセッサー関連の国際会議「30th Hot Chips: A Symposium on High Performance Chips」(2018年8月20日と21日に米国シリコンバレーで開催)に登壇し、機械学習の推論処理用プロセッサーコア「Machine Learning Processor(ML Processor)」について講演した。同社はML Processorを2018年2月に報道発表している(関連記事1)。

登壇したArmのIan Bratt氏。日経xTECHが撮影
登壇したArmのIan Bratt氏。日経xTECHが撮影
[画像のクリックで拡大表示]

 その際には、よく知られたフレームワークで学習したニューラルネットワークをML Processorなど、特定のプロセッサーに実装するための変換ソフトウエア(NN Compiler)も発表している。Armはその後、いくつかのイベントなどでML Processorについて講演したようだ。現在、同社は、開発者向けのホームページで、ML Processorに関するビデオセミナーを公開している(関連ホームページ)。

 今回のHot Chipsでは、ML Processorの概要と、その特徴を説明した。ML ProcessorはCompute Engine(CE)と呼ぶニューラルネットワークの各層の処理を担うブロックが中核である。CEは必要な処理能力に応じて、最大16個まで備えることができる。CE以外には、CEのメモリーを制御するDMA Engine、CE間の通信などを扱うBroadcast Network、それらを制御するControl Unitがある。

 ML ProcessorはCNN(Convolutional Neural Network)の処理に最適になるように設計されているが、RNN(Recurrent Neural Net)など、ほかのニューラルネットワークにも対応できる。データや重みは8ビットの固定小数点でのみを扱う。Android Neural Networks API (NNAPI)とArmNN(Arm Neural Network)に対応する。

 ML Processorを1GHzで稼働させた場合、畳み込み処理のスループットは最大4TOPS(Trillion Operations Per Second)だという。また、7nmプロセスでハードニング(実装)した場合、チップ面積は2.5mm2で、電力効率は3TOPS/Wを上回るとする。2018年中にリリース予定である。

Machine Learning Processor(ML Processor)の概要。Armのスライド
Machine Learning Processor(ML Processor)の概要。Armのスライド
[画像のクリックで拡大表示]