全5756文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 ディープラーニング(深層学習)の課題として、しばしばやり玉に挙げられるのが、学習に大量のデータが必要なことである。このハードルを超えるために、様々な手法が以前から開発されてきた。例えば画像認識の分野では、Few-shot learningと呼ばれる技術がある。新しい種類(クラス)の物体が写った画像を1~数枚DNNに与えるだけで、その物体の認識を可能にするものだ。

 中でも特に難易度が高いタスクを対象にするのが、FSS(few-shot segmentation)と呼ばれる技術である。画像の中からその物体がある領域だけを選び出す、いわゆるセマンティックセグメンテーションを実行する。わずか数枚の画像で物体が写った領域の指示を受けるだけで、新たに与えられた画像の1つ1つの画素ごとに、そのクラスの物体が写っているかどうかを判断する技術だ注1)

 このFSSで最高水準の性能を達成できる技術を、ソフトバンクのAI戦略室 R&D推進室が開発した。