PR

人が教えなくても猫を認識
「ディープラーニング」の衝撃

 ここまで紹介してきたように機械学習を応用することで、モデルを作成するのに必要な人手は大幅に減っている。ただし、コンピュータがデータの中に潜むパターンやルールを学習していく上での「最初の手掛かり」は、人間が与える必要があった。

 具体的には、プログラマーがモデルの「特徴」を設定したり、人間が正解データをコンピュータに教えたりしていた。冒頭の焼きたてパンの画像認識で言えば、画像モデルの特徴は開発元が設定し、パンの画像は種類ごとに店が読み込ませていた。

 ところが最近、人間が何も教える必要のない機械学習技術が台頭してきた。グーグルやマイクロソフトなどが挑む「ディープラーニング」だ。

 ディープラーニングは、画像などの特徴をコンピュータが自ら抽出して、モデルを自動生成する手法である。人工知能の一手法であり、人間の脳を模したシステム「ニューラルネットワーク」を複数組み合わせ、多層構造にして使う。かねてより研究が進んできたが、グーグルが2012年に「コンピュータが猫を認識できるようになった」と発表したことで大きな話題になった(図10)。

図10●グーグルが開発した、「ディープラーニング」を使った画像認識技術
図10●グーグルが開発した、「ディープラーニング」を使った画像認識技術
「猫」の自動分類に成功
[画像のクリックで拡大表示]

 グーグルはYouTubeの動画の中から無作為に1000万枚の画像を取り出し、それを同社が開発したニューラルネットワーク「Google Brain」に3日間連続して読み込ませた。グーグルは1000台のコンピュータを使って、ニューラルネットワークを構築した。