ディープニューラルネット(DNN)は画像認識などで高い精度を持つ半面、「挙動がブラックボックスになりがちだ」とのイメージが一般には流布している。しかし、実際にはDNNの挙動を解析し、誤認識などがあった場合の要因を探れる“デバッグ手法"がここ数年で多く登場している。
DNNを自動車分野向けなどに応用することを目指す日立超LSIシステムズは、そうした手法を社内で既に多く試している企業の1社である注1)。DNNを実用化しようとする企業へのコンサルティングを視野に入れ、学会で発表された各種の技術を実際のデータに適用し、実用的な手法の絞り込みやノウハウの蓄積を図っている。今回は同社の取り組みを紹介しよう。
学習データを改善する指標に
DNNモデルの開発では、最初に用意した学習データだけでは所望の性能を実現できないことがある。その場合、ハイパーパラメータの改善だけでなく、追加の学習データを用意したり、誤認識に影響していると思われるデータを取り除いたりなど、学習データそのものにも手を入れることがある(図1)注2)。機械学習では、システムに与えるデータが「振る舞いを決める仕様」の役割を果たすからだ。
ただし、闇雲にデータを追加するのではデータの収集や管理に要するコストがどこまで膨らむかわからない。DNNの挙動を解析して可視化し、誤認識の要因を推定(デバッグ)できれば、学習データの改善にも取り組みやすくなる。
日立超LSIはDNNの挙動を解析する技術として、大きく分けて2種類の技術を使う計画である。