全1572文字
PR

 人手不足への対応や生産性向上のため、商品の検品工程にAI(人工知能)による画像分類を導入する製造業が増えている。東芝は2022年度の社内実用化に向け、試作や量産初期といった従来導入が難しかった段階への画像分類AIの活用に向けた研究開発を進めている。

 最大の特徴は「教師なし学習」で運用が可能な点にある。教師なし学習とは学習用データに正解・不正解を人手でラベル付けする必要がないタイプの学習方法だ。現在の画像分類AIの主流は手作業でラベル付けする「教師あり学習」である。

 教師なし学習はラベル付けの手間がない分だけ教師ありに比べて導入のハードルが低い。その半面、教師ありに比べて精度を高めにくい。東芝は2つの手法を組み合わせて画像を分類し、教師なしでも高い精度を実現した。

 新技術の名称は「IDFD(Instance Discrimination and Feature Decorrelation)」。画像分類精度のベンチマークテスト「ImageNet-10」において東芝は2020年秋、IDFDを使って95.4%の精度を記録した。同時点で論文発表されているシステムの中で最高性能とされていた71.0%を大きく上回り、同時点で世界最高を記録した。

人手による学習を経ず、高精度に画像を分類する
[画像のクリックで拡大表示]
人手による学習を経ず、高精度に画像を分類する
(出所:東芝)

 IDFDの具体的な仕組みはこうだ。まず第1段階では、1枚の画像を基準に反転・回転・拡大した複数の画像を自動生成し、それぞれの画像を学習させて特徴を抽出する。例えば犬の画像なら、顔や耳、4本の足などといった特徴を抽出・学習し、似たものを同じグループとして分類する。従来の教師なしで多く用いられていた画像全体を分析するAIに比べて、空や海といった背景や周辺物に惑わされずに画像を分類できるという。

 この第1段階は従来もあった手法だ。第1段階単独では「グループに分類するのに必要な、有効な特徴を学習できる根拠が十分でないと考えた」(東芝の中田康太研究開発センターアナリティクスAIラボラトリー上席研究員)。

 そこで第2段階では、抽出した特徴に基づいてさらに多様に分類するアプローチをとった。独自の学習基準を設定し、各特徴量が異なる特徴を表すよう学習できるようにした。同じ鼻でも犬と猫では異なる特徴を持つと人間が自然に学習するイメージだ。産業分野へ応用するに当たり、欠陥の種類まで明確に分類することを想定して着想を得たという。