全1890文字
PR

 「ゲームAIの開発者が再現しようとしている『人間の知性』とは、動くゴールポストのようだ。『チェス世界王者に勝つ』などの目的を達成しても、しばらくたつと『知性』とは言われなくなってしまう」(企画セッションのモデレーター)。

 米人工知能学会が2020年2月7~12日に開催した年次国際会議「AAAI-20」の企画セッションで、著名なゲームAIの開発者が登壇した。チェスから囲碁、StarCraftⅡに至るゲームAIの歴史と、人間の知性に近づこうとするゲームAIの挑戦について議論した。

近づけば遠ざかる「人間の知性」

 米IBMのスーパーコンピューター「Deep Blue」が1997年にチェスの世界王者を破った際、マスメディアは「AIが人間の知性を上回った」と報じた。その一方で「Deep Blueの処理は一種の総当たり探索であり、知性の模倣ではない」との反論もあった。

米IBMによるAI開発の歴史
米IBMによるAI開発の歴史
[画像のクリックで拡大表示]

 さらにチェス世界王者を下したAI技術も、囲碁の領域ではプロ棋士に長らく太刀打ちできなかった。

 囲碁AI「AlphaGo」などの開発を主導した英ディープマインド プリンシパル・リサーチ・サイエンティストのデビッド・シルバー氏は同セッションで、囲碁AIが飛躍的に強くなった要因として2つの技術革新を挙げる。

英ディープマインド プリンシパル・リサーチ・サイエンティストで英ロンドン大学教授のデビッド・シルバー氏
英ディープマインド プリンシパル・リサーチ・サイエンティストで英ロンドン大学教授のデビッド・シルバー氏
[画像のクリックで拡大表示]

 1つは、ある盤面からランダムに手を打った場合の勝率を基に盤面の優劣を評価する「モンテカルロ木探索」が2006年に登場したこと。そしてもう1つは多層ニューラルネットワークによる機械学習「深層学習」が2012年に急浮上したことだ。

囲碁AIを飛躍的に強くした「モンテカルロ木探索」(上)と「深層学習」(下)
囲碁AIを飛躍的に強くした「モンテカルロ木探索」(上)と「深層学習」(下)
[画像のクリックで拡大表示]

 シルバー氏によれば、ディープマインドが囲碁AIの開発を始めた目的は「深層学習はゲームの盤面を評価できるか」という科学上の問いへの答えを得るためだったという。

 シルバー氏はまず人間の棋譜を土台に教師あり学習と強化学習でニューラルネットワークを鍛え、盤面の優劣を高い精度で評価できるようにした。こうして完成した「AlphaGo」は2016年、囲碁の世界トップ棋士を撃破した。

2016年、AlphaGoは世界トップの囲碁プロ棋士イ・セドル氏と対戦し、4勝1敗で勝利した
2016年、AlphaGoは世界トップの囲碁プロ棋士イ・セドル氏と対戦し、4勝1敗で勝利した
[画像のクリックで拡大表示]

 続いてシルバー氏は、開発したAI技術の汎用性を高める方向に舵(かじ)を切った。人間の棋譜に全く頼らず、自己対戦を繰り返して強くなる「AlphaGo Zero」を2017年に開発。続いて囲碁だけでなく将棋やチェスにも対応した「Alpha Zero」、さらにAtariのゲームにも同一のAIモデルで対応した「MuZero」を2019年に公開した。

「AlphaZero」は囲碁に加えてチェスや将棋にも対応した
「AlphaZero」は囲碁に加えてチェスや将棋にも対応した
[画像のクリックで拡大表示]
「MuZero」はさらにAtariのビデオゲームにも対応した
「MuZero」はさらにAtariのビデオゲームにも対応した
[画像のクリックで拡大表示]

 Deep Blue開発責任者である米IBM トーマス・J・ワトソン研究所 特別研究員のマレー・キャンベル氏は「Alphaシリーズが示したAIの汎化性能は、人間の知性に近づくキーパーツではないか」と指摘する。「Deep Blueはチェスという特定のゲームにのみ適応したマシンだった。Alpha Zeroは(将棋や囲碁、チェスなどの)多様な二人零和有限確定完全情報ゲームに適応でき、よりインテリジェントと言える。知性に向けた正しい方向への1歩だ」。

米IBM トーマス・J・ワトソン研究所 特別研究員のマレー・キャンベル氏
米IBM トーマス・J・ワトソン研究所 特別研究員のマレー・キャンベル氏
[画像のクリックで拡大表示]

この記事は有料会員限定です

日経クロステック有料会員になると…

専門雑誌8誌の記事が読み放題
注目テーマのデジタルムックが読める
雑誌PDFを月100pダウンロード

日経電子版セット今なら2カ月無料