全2912文字
PR

 しかし、このように判断の基準を決めるにあたって人間が介在した場合は機械学習とはいいません。「機械学習モデルである」と言うためには、人間はモデルにデータを与えるだけにとどめ、上のプログラムで実装されているような条件判断の基準はモデルが自分で見つけ出す必要があるのです。これが先ほどの原則2の「学習により規定される」という条件の意味になります。

機械学習の3つの方法

 機械学習モデルに必須の学習ですが、具体的な方法として3つあります。

教師あり学習
 学習データが、モデルに対する入力データとその時のあるべき出力である正解データ(教師データともいいます)のセットになっている学習法です。

教師なし学習
 正解データなしに、学習データのみが与えられ、そこからなんらかの出力を得る学習法です。対象データのみの情報からデータのグループ分けを自動的に行うクラスタリングが教師なし学習の代表的なものです。

強化学習
 教師あり学習と教師なし学習の中間の学習法です。システムは観測値を入力として「方策」と呼ばれる行動方針を出力とし、外部にはたらきかけます。出力する段階で正解はわからないのですが、しばらく経過した後で報酬という形でそれが正解かどうかがわかります。

 この3つの学習法のうち教師あり学習が、仕組みが最も単純でわかりやすいモデルとなります。

 教師あり学習のモデルの出力値には、例えば店の1日の売り上げ予測のような数値を出力とするモデルと、写真に写っている動物の種類のような離散値(「クラス」あるいは「ラベル」とも呼びます)を出力とするモデルがあります。前者を回帰モデル、後者を分類モデルと呼んで区別します。

回帰モデルと分類モデル
回帰モデルと分類モデル
[画像のクリックで拡大表示]

 教師あり学習は、学習フェーズと予測フェーズの2つからなります。

 学習フェーズとは、下図のように入力データと正解データ(教師データ)からなる学習データが与えられていて、それを基にできるだけ精緻な(予測結果が正解データに近い)モデルを作るフェーズです。

学習フェーズ
学習フェーズ
[画像のクリックで拡大表示]

 予測フェーズでは、正解データはわからず入力データだけが存在します。機械学習モデルは入力データから正解データはなんであるかを予測し、システムの出力とします。

予測フェーズ
予測フェーズ
[画像のクリックで拡大表示]