全2970文字

 ここ数年、データ分析の手法として話題なのが「機械学習」です。「あるキーワードがGoogle上で検索されている度合い」を調べられるツール「Googleトレンド」のグラフで、「機械学習」について見てみましょう。

 2004年から現在まで、「人工知能」がどのくらい検索されているかを表したのが青い線、「機械学習」を表したのが赤い線です。2016年頃にバズワードとなった「人工知能」の人気度が次第に下がってきており、2019年には「機械学習」が「人工知能」を上回っています(図1)。この傾向を筆者は「人工知能の中身が機械学習というアルゴリズムであることが、2019年頃から広く知られ始めた」ためではないかと考えています。今回は、このように次第に用語として一般化しつつある機械学習の基本を解説します。

図1●「Googleトレンド」で「人工知能」(青いグラフ)と「機械学習」(赤いグラフ)を調べた結果
図1●「Googleトレンド」で「人工知能」(青いグラフ)と「機械学習」(赤いグラフ)を調べた結果
[画像のクリックで拡大表示]

アルゴリズムとは「やり方」「手順」のこと

 機械学習はアルゴリズムの名称です。そのため機械学習について理解するには、まずアルゴリズムとは何かを知っておく必要があります。ひとことで言うと、アルゴリズムとは何らかの目的を達成するための「やり方」「手順」のことです。例えば、以下の5つの数字(データ)の平均を求める方法を考えてみましょう。

10, 19, 30, 11, 40

 おそらく皆さんは、以下のような式で平均を求めるでしょう。

(10 + 19 + 30 + 11 + 40)÷ 5 = 22

 ごく基本的な算数の知識に基づいて何げなくこなしてしまうこうした平均の計算にも、手順、つまりアルゴリズムがあります。頭の中でどんな計算をしたか改めて考えて一つずつ書き出してみると、以下のような手順になると思います。

平均を求めるアルゴリズム
  • 手順1: データの合計値を求める
  • 手順2: データの個数を求める
  • 手順3: 手順1で求めた合計値を手順2で求めたデータの個数で割り算する

 この三つの計算が、平均を求める時の「やり方」「手順」――つまりアルゴリズムなのです。