今回は、ディープラーニングの技術のうち、強化学習(深層強化学習)と生成モデルを取り上げる。例題と解説を中心に、技術の仕組みや応用例について解説する。
例題は、日本ディープラーニング協会(JDLA)監修の『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』(翔泳社、以下「公式テキスト」)掲載の問題を題材とする。
強化学習
最初は、強化学習についての例題だ。
- 強化学習は出力が与えられないことから、教師なし学習に分類することができる。
- 強化学習は状態をフィードバックしてやることから、それを出力とみなした教師あり学習に分類することができる。
- 強化学習は環境から得られる状態をもとに、どのような行動をとるべきかを学習する手法である。
- 強化学習は、機械が自律的に行動することができるようになる手法であり、教師あり学習を応用したものである。
出所:公式テキストp183 6章 章末問題 問題5