全2353文字
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 IoT向けの安価な小型コンピュータとして注目を集める「Raspberry Pi(ラズパイ)」の全シリーズに、GPUが標準搭載されていることをご存じだろうか。

 元は教育用途として始まった同デバイスだが、ユーザーが3次元グラフィックスに触れられるよう、米Broadcom社製のメインチップにGPUコア「VideoCore」が搭載されているのである。

 IoTやAI技術を手掛ける日本のベンチャー、Idein(イデイン)は、このラズパイ1~3のGPUをディープラーニング(深層学習)推論のアクセラレータとして使えるようにしたことで知られる1)。このラズパイのGPUは米NVIDIA社のGPGPUと異なり、グラフィックス以外の汎用演算を行うための開発環境やツールがチップ開発元から提供されている訳ではない。

 本誌が2019年3月号で解説したように、Ideinは当時、公開されている命令セットアーキテクチャ(ISA)の情報を基に、このVideoCore向けのアセンブラ「py-videocore」を独自に実装。さらにはディープニューラルネット(DNN)のモデルをこのVideoCore上で実行できる形式に変換するコンパイラまで自社開発し、VideoCoreをDNN推論アクセラレータとして使えるようにした。

 世界広しといえども、ラズパイのGPUでDNN推論を現実的に実行できるようにした企業は、このIdeinだけである注1)。ラズパイのGPUは、家庭用ゲーム機の初代XboxのGPUを上回るほどの性能がある。ラズパイでDNN推論というと、専用アクセラレータをUSBドングルでラズパイに外付けするアプローチが多いが、Ideinのソフトを使えば、そうした外付け部品なしに、標準構成のままDNNを高速化できる。GPU側で画像認識などのDNN推論を実施できれば、メインCPUは他のタスクに丸々使えるため、非常に有用である。

最新のPi4の新GPUをハック

 そんなIdeinが、また驚くべき成果を出した。

 ラズパイは2019年に処理性能などを向上した第4世代品「Raspberry Pi 4(以下、Pi4)」が発表されたが、その新GPUでもDNN推論アクセラレーションができるようにしたのだ(図1)。この新GPUは、実は命令セットなどの情報が皆無。一体なぜ開発できたのだろうか。

図1 Raspberry Pi 4のGPUを使いDNN推論を高速化
図1 Raspberry Pi 4のGPUを使いDNN推論を高速化
Raspberry Pi 4 Model B(写真上)に標準搭載されているGPUでDNN推論を実行できるようにした。MobileNetV3を18.4フレーム/秒で動作させている(写真下)。(写真:Idein)
[画像のクリックで拡大表示]