全5558文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 ディープラーニングはデータの適切な表現方法(または特徴関数)を自動獲得し、多くのタスクで人が設計した表現方法を使った場合よりも高い性能を達成できることを示してきた。

 こうした表現学習の多くは何らかの教師あり学習の副産物として獲得されている。例えばImageNetの画像分類タスクで得られたモデルは画像認識の学習済みモデルとして多く使われている。

著者の岡野原大輔氏
著者の岡野原大輔氏

 しかし、教師あり学習を使って表現学習した場合、基本的にはタスクに関係する表現しか獲得されない。例えば画像分類タスクで学習した場合、分類に不必要な色情報や物体の個数といった情報は表現に含まれない可能性が高い。

 そのため、その表現を画像キャプショニングといった別のタスクに使うことが難しい。このためタスクに依存せず汎用的に使える表現を獲得する方法が求められていた。