全2900文字

 機械学習をマスターする上でカギとなる、「損失関数」。機械学習モデルにおいて、予測値と正解値(正解データ)がどの程度近いかを示す指標となる関数です。

 そのイメージをより具体的に持つため、簡単な例題をここで扱ってみましょう。解を導き出すのに少し時間がかかりますが、「偏微分」などの高度な数学は全く使いません。

 2次関数など高校1年生レベルの数学をおさらいしながら解説していきます。一通り読めば、「数学を使って機械学習モデルを解く」というイメージがつかめるので、ぜひ解を導くところまで読み進めてください。

 題材として「単回帰」と呼ばれる、1つの実数値の入力(x)から1つの実数値(y)を予測するモデルを取りあげます。具体的な処理内容としては、成年男子の身長x(cm)を入力値に、体重y(kg)を出力値とするようなモデルを考えることにします。モデルの内部構造は「線形回帰」と呼ばれるもので考えます。

 線形回帰とは1次関数で予測するモデルのことで、入力データをx、出力データをyで表すとき、線形回帰の予測式は次のような形になります▼1式1)。

y = w0+ w1x(式1)

 最初に対象となるデータが以下の3つである場合で考えてみましょう。

学習データ1
学習データ1
[画像のクリックで拡大表示]

 実は、このデータはすぐに答えが出るように細工がしてあるので、下のように、式1にあたる式を簡単に出せます。

y = x - 105