全7311文字
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 ディープラーニングの研究で、米グーグルなどの大手IT企業が圧倒的に強いのはなぜか。理由の1つは、DNN(ディープニューラルネット)の学習に巨大なデータセットを利用できることである。例えば画像認識の分野で、グーグルは約30億枚の画像からなる非公開のデータセット「JFT-3B」をDNNの事前学習に用いている。その効果は凄まじく、ImageNetの分類タスクの認識精度で上位7位までのDNNが使っているほどである注1)

 産業技術総合研究所(産総研)の片岡裕雄 主任研究員のグループが開発を進める技術「FDSL(formula-driven supervised learning)」は、こうした超大規模のデータセットに対抗できる手段を目指している1)。数式によって生成した画像で画像認識用DNNを事前学習させることで、ファインチューニング後のDNNの精度を高める技術だ(図1)。数式から画像を作るので原理上データセットをいくらでも大規模化でき注2)、ラベルづけも自動のため画像に人手でラベルをつける場合の間違いやバイアスも避けられる。現実の事物を写した画像(自然画像)を使う場合につきものの、著作権やプライバシーなどの侵害問題も回避できる。