全2525文字
PR

 デンソーやドイツDaimler(ダイムラー)が出資する米AI(人工知能)半導体ベンチャーBlaize(ブレイズ)が日本での事業を本格化する。「GSP(グラフ・ストリーミング・プロセッサー)」と呼ぶ独自の半導体を使い、AI処理を高速かつ低電力でこなす。狙う市場はクルマのほか、スマートシティーや産業機器など幅広い。トヨタ自動車が静岡県裾野市に建設するスマートシティー「Woven City(ウーブン・シティ)」での採用も目指す。

ブレイズCEOのディナカー・ムナガラ氏
ブレイズCEOのディナカー・ムナガラ氏
(出所:ブレイズ)
[画像のクリックで拡大表示]

 「GSPは、CPU、GPUに次ぐ新たなプロセッサーだ。CPUやGPUに比べて、AI処理の電力効率やコスト効率を数十倍に高められる」。ブレイズCEO(最高経営責任者)のディナカー・ムナガラ(Dinakar Munagala)氏は、いわば第3のプロセッサーといえるGSPを、こう説明する。

 車載カメラの映像から、車両や歩行者、レーンなどをAIで識別する「セマンティックセグメンテーション」の事例では、米NVIDIA(エヌビディア)の車載SoC(System on Chip)「Xavier」に比べて消費電力を5分の1にでき、単位電力・コスト当たりの性能(パフォーマンス/W/ドル)を15倍にできると主張している。

エヌビディアのXavierに比べて電力を5分の1に
エヌビディアのXavierに比べて電力を5分の1に
(出所:ブレイズ)
[画像のクリックで拡大表示]

 16個のGSPコアを集積したチップのピーク性能は16TOPS(毎秒16兆回)、消費電力は7Wである。韓国Samsung Electronics(サムスン電子)の14nm世代プロセスで製造する。この先も5年以上の製品ロードマップを描いているという。

16個のGSPコアを集積したチップの概要
16個のGSPコアを集積したチップの概要
(出所:ブレイズ)
[画像のクリックで拡大表示]

 ブレイズの創設者であるムナガラ氏とCTO(最高技術責任者)のSatyaki Koneru氏は、いずれも米Intel(インテル)出身でGPUなどを設計していた。「CPUやGPUを知り尽くしているからこそ、GSPを開発できた」(ムナガラ氏)とする。

演算器の稼働率を高める

 GSPはプログラムの構造を解析し、ハードウエアスケジューラーによってスレッド(命令粒)を動的に演算器に割り当てることで、演算器の稼働率(使用率)を高め、高速かつ低電力な処理を実現する。例えば、ディープラーニング(深層学習)ではデータを段階的に処理する必要があり、最初の処理が終わるまで次の処理ができず、演算器が待機状態に陥りやすい。これに対し、GSPでは最初の処理が完了する前に、必要なデータを次の処理に送ることで、演算器の稼働率を高める。

ディープラーニングでは、入力データに対して、A、B、C、Dといった処理を順次行う。通常のCPUやGPUは、Aの処理が完了するまでB、C、Dを実行できない。これに対し、GSPはAが完了する前に、必要なデータを次のB、Cに渡すことで、処理を前倒しできる。大量の中間データを一時保存する必要がなく、外部メモリーへのアクセスが減るため、消費電力を低減できるほか、オンチップメモリーの容量も減らせるため、チップ面積を小さくでき、低コスト化できる
ディープラーニングでは、入力データに対して、A、B、C、Dといった処理を順次行う。通常のCPUやGPUは、Aの処理が完了するまでB、C、Dを実行できない。これに対し、GSPはAが完了する前に、必要なデータを次のB、Cに渡すことで、処理を前倒しできる。大量の中間データを一時保存する必要がなく、外部メモリーへのアクセスが減るため、消費電力を低減できるほか、オンチップメモリーの容量も減らせるため、チップ面積を小さくでき、低コスト化できる
(出所:ブレイズ)
[画像のクリックで拡大表示]

 この技術は、デンソーの半導体設計子会社であるエヌエスアイテクスが2017年に発表した自動運転向けの新型プロセッサー「データ・フロー・プロセッサー(DFP)」にも使われている。ブレイズは当時、ThinCI(シンクアイ)という社名でDFP開発に協力していた。2020年10月には、エヌエスアイテクスが日本国内を中心にブレイズ製品の拡販や技術支援を行うと発表し、さらに関係を深めている(リリース)。