いよいよ今回から、統計と機械学習に関する専門的な内容に入っていく。まずは、機械学習の代表的な手法や評価について、重要なポイントを見ていこう。
専門用語や数式が出てきて、とっつきにくいと感じる人もいるかもしれない。筆者自身、AI(人工知能)や機械学習の専門知識がない状態でG検定合格を目指した経験があるため、その気持ちはよく理解できる。そこで当時の筆者自身が抱いていた疑問や、実際に業務でAIを実装していく中で感じたことなども織り込んでいく。
例題は、日本ディープラーニング協会(JDLA)監修の『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』(翔泳社、以下「公式テキスト」)掲載の問題を題材にする。
機械学習の手法を押さえる
最初は、機械学習の手法に関する問題を見てみよう。
- ランダムフォレストに比べ、勾配ブースティングは結果が得られるまでの計算に時間がかかる。
- ロジスティック回帰はニューラルネットワークの一種である。
- ディープラーニングの手法が出てくる以前は、サポートベクターマシンが最も汎化性能の高い手法であった。
- ニューラルネットワークは隠れ層の数を色々変えて学習できるため、アンサンブル学習の一種といわれている。
出所:公式テキストp111 4章 章末問題 問題1