人工知能学会は2018年6月5日、同学会が主催した画像認識コンペティション「JSAI Cup 2018」の結果を発表し、入賞者5人を表彰した。1位~5位の入賞者が実施したプレゼンテーションを通じ、深層学習(多層のニューラルネットを使った機械学習)で画像認識AIの精度を高める最新のテクニックを紹介しよう。
今回のコンペのテーマは「食材の分類」。食材の画像データから、タマネギ、きゅうりなど55種類の材料を分類する画像分類器を設計し、正解率の高さを競う。
主催者が提示した学習用の画像データは、協賛のクックパッドが提供した1カテゴリ約290枚×55カテゴリの1万5932枚である。コンペの開催期間は2018年1月22日~3月29日。応募者は121人で、うち会社員が51%、学生が39%だった。20代の参加が目立ったという。
二つの禁止事項で現実に即したコンペに
今回のコンペは、企業が深層学習を使う際に直面する困難を考慮して、主に二つの禁止事項を設けた。まず、ネットワークの構造やハイパーパラメータが異なる複数のモデルを同時に学習させ、複数モデルの多数決などで解を出す「アンサンブル学習」は使えない。アンサンブル学習はGPUサーバーなど学習用インフラを豊富に持つ参加者ほど有利になるためだ。
もう一つ、ImageNetなど既存の画像データベースを学習させた学習済みモデルの利用は禁止とした。クックパッドが提供した1万5932枚の画像データのみを使って学習させる。
1分類当たり約300枚という写真データの量は、画像認識向けの学習データとして決して十分とは言えない。この制限は学習データを大量に集めるのが難しい現実の課題を反映したものといえる。学習モデルが少ない学習データに過剰に適応してしまい、精度の低下を招く「オーバーフィッティング(過学習)」をいかに防ぐかが勝負のカギになる。
「JSAI Cup 2018」で優勝したのは東京大学大学院情報学環 相澤・山崎研究室 修士1年の郁 青氏だった。
郁氏のプレゼンテーションから、正解率98.1%という最高精度の学習モデルを実現した手法を明らかにする。