全4239文字

 今回は、ディープラーニングの技術のうち、強化学習(深層強化学習)と生成モデルを取り上げる。例題と解説を中心に、技術の仕組みや応用例について解説する。

 例題は、日本ディープラーニング協会(JDLA)監修の『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』(翔泳社、以下「公式テキスト」)掲載の問題を題材とする。

強化学習

 最初は、強化学習についての例題だ。

例題1:強化学習に関する以下の文章のうち、適切なものを選べ。正解は1つとは限らない。
  1. 強化学習は出力が与えられないことから、教師なし学習に分類することができる。
  2. 強化学習は状態をフィードバックしてやることから、それを出力とみなした教師あり学習に分類することができる。
  3. 強化学習は環境から得られる状態をもとに、どのような行動をとるべきかを学習する手法である。
  4. 強化学習は、機械が自律的に行動することができるようになる手法であり、教師あり学習を応用したものである。

出所:公式テキストp183 6章 章末問題 問題5