機械学習ではデータを基に、何らかの値を予測することが可能だ。機械学習はアルゴリズムの名称であり、「やり方」「手順」を指す。種類として「教師あり学習」や「教師なし学習」などがある。
ここ数年、データ分析の手法として話題なのが「機械学習」です。今回はその機械学習について、基本を解説します。
まず、「あるキーワードがGoogle上で検索されている度合い」を調べられるツール「Googleトレンド」のグラフを題材に、機械学習について見てみましょう。
2004年から現在まで、「人工知能」「機械学習」がどのくらい検索されているかを表したのがグラフです。2016年頃にバズワードとなった「人工知能」の人気度が次第に下がってきており、2019年には「機械学習」が「人工知能」を上回っています。
この傾向を筆者は「人工知能の中身が機械学習というアルゴリズムであることが、2019年頃から広く知られ始めた」ためではないかと考えています。
アルゴリズムは「やり方」と「手順」
機械学習はアルゴリズムの名称です。そのため機械学習について理解するには、まずアルゴリズムとは何かを知っておく必要があります。ひとことで言うと、アルゴリズムとは何らかの目的を達成するための「やり方」「手順」のことです。例えば、以下の5つの数字(データ)の平均を求める方法を考えてみましょう。
10、19、30、11、40
おそらく皆さんは、以下のような式で平均を求めるでしょう。
(10+19+30+11+40)÷5=22
ごく基本的な算数の知識に基づいて何げなくこなしてしまうこうした平均の計算にも、手順、つまりアルゴリズムがあります。頭の中でどんな計算をしたか改めて考えて1つずつ書き出してみると、以下のような手順になると思います。
【平均を求めるアルゴリズム】
手順1:データの合計値を求める
手順2:データの個数を求める
手順3:手順1で求めた合計値を手順2で求めたデータの個数で割り算する
この3つの計算が、平均を求めるときの「やり方」「手順」――つまりアルゴリズムなのです。