PR

 ソシオネクストは、エッジでの推論処理を効率良く行うことを狙ったICを試作し、その動作および性能を確認した。今回のICの試作や評価は、国⽴研究開発法⼈新エネルギー・産業技術総合開発機構(NEDO)の委託事業である「進化型・低消費電⼒AI エッジ LSIの研究開発」(NEDO関連ページ)の取り組みの一環。

試作したチップ
試作したチップ
ソシオネクストの写真
[画像のクリックで拡大表示]

 今回の試作ICには、ディープラーニング推論処理を高速かつ低消費電⼒で実行するための「量子化DNN技術」が搭載されている。これによって、推論処理を実行する上で必要なパラメーターやアクティベーションの量子化(固定小数点化)や低ビット化がスムーズに行えるという。一般的な8ビットに加えて、1ビット(Binary)、2ビット(Ternary)などへの低ビット化技術と独自のパラメーター圧縮技術を組み合わせることで、少ない演算資源で大量の計算処理が実行でき、かつデータ量を大幅に削減可能だとする。

 さらに、今回、ソシオネクストは、高効率なデータ供給を行うオン・チップ・メモリー回路技術も開発した。既存の技術では大容量・広帯域のオン・チップ・メモリーや外部メモリーが必要だったが、新規開発技術によって、メモリー使用量を大幅に削減可能になるという。

 同社は、上記の技術を採用した「量子化DNNエンジン」を集積するテストチップの設計と試作を行い、その動作と性能を確認した。「YOLO v3」の学習済みモデルを使った推論処理では、30フレーム/秒での検出と5W以下の消費電⼒を達成したという。これは、汎用GPUで処理した場合の10倍以上の電⼒効率になるとする。