東芝は2022年5月25日、画像を1枚追加するだけで検出対象を増やせる人工知能(AI)技術「Few-shot 物体検出AI」を開発したと発表した。AIを再学習する手間が省ける。新製品や部品の切り替えで扱う対象がしばしば変わる工場や、商品の入れ替わりが激しい物流倉庫など、検出対象が高い頻度で変更になる現場での利用に向く。2023年度中の製品化を目指す。

「Few-shot 物体検出AI」の特徴
「Few-shot 物体検出AI」の特徴
検出対象の物体が増えてもAIを再学習しなくて済む。(出所:東芝)
[画像のクリックで拡大表示]

 通常、例えば画像認識AIで二輪車を検出しようとする場合は、二輪車にあたる画像とその画像が二輪車であるという情報(ラベル)を、学習データとしてあらかじめ用意する必要がある。同社が開発した技術を用いると、当初の学習データに二輪車というラベルがなくても、AIによる検出が必要になった時点で二輪車の画像1枚を入力すれば、新たに検出が可能になる。

 一般に、深層学習を用いた画像認識AIでは、画像に登場する複数の物体のうち、あらかじめ「正解」として教示している物体を検出対象として学習する。その他の物体は「背景」として扱われるため検出されない。新たな物体を検出できるようにするには、AIの再学習が必要になる。「AIの中には再学習が要らない方式もあるが、実用化レベルの検出精度は得られていなかった」(同社)

「Few-shot 物体検出AI」の仕組み
「Few-shot 物体検出AI」の仕組み
あらかじめ物体候補を抽出しておく。(出所:東芝)
[画像のクリックで拡大表示]

 今回開発したAI技術では、学習データの画像のうち背景とされる領域から、あらかじめ物体候補を自動的に抽出しておく。これらの抽出した複数の物体候補と、新たに検出したい物体の画像1枚を比較することで、分析対象の画像から新規物体を検出する仕組みだ。

 公開データセットで性能を評価したところ、46.0%の検出精度を得られた。同社によると、深層学習によるAI技術のうち再学習が不要な既知の方式の検出精度は21.2%にとどまっていた。「今回の技術で検出精度が大幅に向上し、世界最高精度を達成した」(同社)。