全2912文字
PR

 ここまでで説明した機械学習モデルの定義は、その内部実装には一切触れておらず、いわばブラックボックスとしての機械学習モデルの外部的な振る舞いに関するものでした。ここで定義した機能を実現する方法には様々なものがあります。例えば決定木と呼ばれる分類モデルは、データを観察してif then elseのルールを自動的に作り出すという、人間の考えに近い仕組みのモデルとなっています。

 しかし、これから取りあげるモデルでは、全く別のアプローチをします。ある構造とパラメーターを持った数値計算をする関数を用意し、これを機械学習モデルそのものとします。そして、この関数の持つパラメーター値をうまく調整することで、目的とするような値を出力するモデル(つまり、関数)を作るというアプローチです。

 この様子を下図に示しました。

損失関数を利用した学習アプローチ
損失関数を利用した学習アプローチ
[画像のクリックで拡大表示]

 「損失関数」は、モデルの予測値と正解値(正解データ)がどの程度近いかを示す指標となる関数です。すべての学習データに対してyp=yt(予測値=正解値)の場合、値はゼロとなり、2つの値の差が大きいほど、関数の値も大きくなるような性質を持っています。

 「勾配降下法」は、損失関数を最小とするような最適なモデルのパラメーターを見つけるためのアルゴリズムの名前です。

 機械学習をマスターするには、この「損失関数」と「勾配降下法」の考え方を理解することが重要なのです。損失関数と勾配降下法がどんなものかは、次回詳しく解説します。

▼1
隔離した部屋にあるコンピューターのシステムと人間が会話して、会話の相手がコンピューターか人間かどうか判別できなければ、そのシステムは「人工知能である」と定義しました。
▼2
ルールベースシステムの中で歴史的に最も有名なのは1970 年代に開発されたMYCIN というシステムです。これは500 程度のルールからなる知識ベースを用いて患者の血液疾患を判定し、抗生物質を処方するシステムです。診断の正確さは65% 程度で、専門医でない一般の医者の診断より精度が高いといわれています。