全3937文字
PR

 ルネサス エレクトロニクスは、同社独自のハードウエアアクセラレーター「DRP(Dynamically Reconfigurable Processor)」を活用することで、MPU(マイクロプロセッサー)のAI(人工知能)処理の高速化を図っている(図1)。現在、同社は、CPUコア上のソフトウエアに比べて1000倍速く推論できるMPUの開発を進めており、2023年中に市場投入の予定である*1。高速化に加えて、AIの現場への普及を妨げている2つの課題の解決を狙う新機能の追加を念頭にして、開発を進めている。

図1 開発中のMPU(マイクロプロセッサー)を載せた評価ボード(左)と狙うアプリケーション(右)
図1 開発中のMPU(マイクロプロセッサー)を載せた評価ボード(左)と狙うアプリケーション(右)
MPUは、「DRP-AI」と呼ぶビジョン処理/AI処理向けに強化したアクセラレーター回路を集積している(画像:ルネサス エレクトロニクス)
[画像のクリックで拡大表示]

 DRPは電源投入後の動作中にダイナミックに(クロックごとに)回路構造を再定義可能なため、小面積のチップで様々な処理の高速化が図れる。ルネサスはDRPを混載するMPU「RZ/A2M」を2018年10月に発売した*2。このMPUはCPUコアで動作するソフトウエアに比べて10倍速く推論できる。その後、同社はDRPをビジョン処理/AI処理向けに強化した「DRP-AI」を開発した(図2)。このDRP-AIを混載するMPU「RZ/V2M」は2020年6月に発表されている*3。DRP-AIを混載したMPUは、CPUコアで動作するソフトウエアに比べて100倍速く推論できる。

図2 DRP-AIは2つの部分、DRPとAI-MACから成る
図2 DRP-AIは2つの部分、DRPとAI-MACから成る
DRPは、電源投入後の動作中にダイナミックに(クロックごとに)回路構造を再定義可能な回路(プロセッサー)である。推論ではニューラルネットワークのPooling層などを扱う。AI-MACは積和演算を担い、推論ではConvolution層を担当する。DRPとAI-MACは密結合して連係動作する。ルネサスによれば、他社のAIアクセラレーターはAI-MACに相当する回路しか含まない場合がほとんどで、Pooling層などはCPUコアが処理しているという。このため、電力効率が低い。一方DRP-AIはCPUコアなしで全層を処理できるため、電力効率が高いとする(画像:ルネサス エレクトロニクス)
[画像のクリックで拡大表示]

 現在、同社は、DRP-AIの改良を進めており、その改良したDRP-AIの混載と新規開発したソフトウエアを利用することにより、CPUコアで動作するソフトウエアに比べて1000倍速く推論できるMPUを開発中である*4。今回、開発の狙いや技術的方策について、ルネサスの3人のエンジニアに話を聞いた。同社エンタープライズ・インフラ・ソリューション事業部の野瀬浩一氏(シニアプリンシパルエンジニア)、馬場光男氏(シニアダイレクター)、戸井崇雄氏(シニアマネージャー)である。開発に当たっては、速度を高めることに加えて、AIの現場への普及を妨げている2つの課題を解決することを狙った。

*4:2023年末までに「RZ/Vシリーズ」の新製品として市場投入の予定である。

コストと使い勝手の課題に挑む

 今のところ、AI技術者やAI向け半導体メーカーが期待するほど、AIの現場への普及は進んでいない。今回の開発に当たり、ルネサスは同社ユーザーなど、AIを導入したり、導入を検討したりする現場を訪ねて、普及の妨げ要因を探った。その結果を基に、今回の開発では、高速化だけでなく、普及の妨げ要因の解消/緩和も同時に狙った。「半導体メーカーとして、AIを普及させるためにできることは何かと考えたときに、高速化だけでは十分ではないことに改めて気付かされた」(同社エンジニア)。

 今回、解消/緩和に取り組んだ普及妨げ要因は2つ、すなわち(1)導入コストと(2)使い勝手である。まず、1つ目の導入コスト。高い推論精度を得るには、高性能な処理ICが必要だが、そうしたICは一般に高価である。また、高性能なチップは一般に消費電力が大きく、熱対策のコストもかさむ。例えば、工場のラインには何台もロボットが並んでおり、ロボットそれぞれにAI処理機能をもたせるためには、AI処理を低消費電力で実行する安価なICが求められる。

 2つ目の課題、使い勝手は、現在のAI処理では一般に、学習と推論が完全に分けられた形で行われるという点に着目した。現在は多くの場合、現場のデータを集めてクラウドで学習し、学習済みニューラルネットワークを使った推論を現場の機器やコンピューターに展開して実行する。このため、学習用にデータを採集した現場の動作環境と、推論を実行する現場動作環境には不整合が生じることがある。例えば、工場のラインを流れる製造物の画像認識にAIを適用する場合、照明の当たり具合に差が生じる。この差によって期待した認識精度が得られないと、現場の照明環境を学習時のそれに近づけるように調整しなければならない。すなわち、AIが最適動作するように、現場を調整するという、本末転倒の事態が発生している。現場の環境にAIを簡便に適合させる方策が求められる。