全4565文字
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 深層学習(ディープラーニング)の大きな特徴は、データを問題が解きやすいような表現に変換する方法を学習によって獲得する、いわゆる表現学習ができる点である。データを適切に表現できさえすれば、その後、分類や回帰などの問題は簡単に解けるのに対し、うまく表現されていない場合はその後どれだけ頑張ってもうまく問題を解くことはできない。

 また、良い表現方法を事前学習によってあらかじめ獲得しておけば後続タスクの精度を改善できるだけでなく、学習に必要なデータを劇的に減らせる。例えば、画像を入力とした強化学習においても、画像の表現学習を中心とした工夫を組み合わせることにより、必要な経験回数を1/500近くも減らすことができると報告されている1)

著者の岡野原大輔氏
著者の岡野原大輔氏

 深層学習が登場した2006年ころは自己符号化器(Autoencoder)などによる教師なし学習によって表現学習を行っていたが、2012年ころに教師あり学習が成功し始めて以降は、教師あり学習による表現学習が盛んとなっていた。しかし教師あり学習による表現学習にはいくつかの問題がある。

 1つ目は教師データを作るのにコストがかかり、利用可能なデータが限られる点、2つ目は教師あり学習で必要なタスクに特化した表現が獲得されてしまい、他のタスクに使えないような表現が獲得されてしまう点である。例えば、画像分類の教師あり学習で得られた表現には、画像中の物体の位置情報などは失われてしまっている。