全4651文字
PR

現在は第3次人工知能(AI)ブームといわれている。このブームの立役者の1つが「強化学習」。本連載は、強化学習の基礎から最新の話題まで、分かりやすく解説する。読者の方に技術のエッセンスを直感的に理解してもらい、より専門的な教科書や論文を読みこなせるようになってもらうことが目標である。今回は強化学習と深層学習、それぞれの役割について説明する。

 強化学習の威力を世界に知らしめた大きな話題は、米Google(グーグル)傘下の英DeepMind(ディープマインド)が開発した囲碁AI「AlphaGo」でしょう。強化学習を応用して棋力を磨いたAlphaGoは、2016年3月に世界的なトッププロだったイ・セドル棋士に4勝1敗と圧勝して一躍名を上げました(図1)。

図1 AlphaGoはイ・セドル棋士に圧勝した
図1 AlphaGoはイ・セドル棋士に圧勝した
出所:DeepMind
[画像のクリックで拡大表示]

 2018年12月にDeepMindは、さらに技術を改良したAI「AlphaZero」の評価結果を発表しました1)。囲碁だけでなく将棋やチェスでも人間が戦った棋譜などを一切使わず、ゲームのルールに従って打てる手を試していくといった、まさにゼロから学習し続けることによって史上最高とされる強さを実現できたことを明らかにしています2)