全3477文字
PR

 人工知能(AI)の能力が人間を上回る領域が、より高度かつ複雑な方向へ拡大を続けている。2019年10月末には英ディープマインド(DeepMind)のAIが米ブリザードエンターテインメント(Blizzard Entertainment)のオンライン戦略ゲーム「StarCraft II」の対戦で大きな成果を上げたことが、欧米で話題となった。囲碁よりもオンライン戦略ゲームで人間に勝つことの方が、現実世界でのAI活用を目指す上で重要とされているためだ。

 米グーグル(Google)系のディープマインドは囲碁の世界トッププロに勝利したAI「AlphaGo」を開発したことで知られている。そのディープマインドが2019年10月30日に英誌「Nature」で発表した論文において、同社が深層強化学習を使って開発したAIの「AlphaStar」がStarCraft IIのオンライン対戦で「上位0.2%入り(グランドマスターレベル)」を達成したと発表した。人間のプレーヤーの99.8%に勝利する強さとなる。

「StarCraft II」のゲーム画面
「StarCraft II」のゲーム画面
(出所:米ブリザード・エンターテインメント)
[画像のクリックで拡大表示]

 StarCraft IIは日本語版が販売されていないため日本では著名ではないが、世界的には非常に人気の高いオンライン戦略ゲームであり多数の「プロゲーマー」が存在することでも知られている。またAIが囲碁や将棋の世界トッププロに勝つようになる中でも、StarCraft IIのようなオンライン戦略ゲームではAIは人間のトッププレーヤーになかなか勝てなかった。そのためAlphaStarの「偉業」は米CNNや英BBCなど一般メディアも取り上げるなど、欧米では高い関心を集めている。

囲碁より現実世界に近いStarCraft II

 なぜAIにとって囲碁や将棋よりもStarCraft IIで勝つ方が難しく画期的とされているのか。それは囲碁や将棋よりもStarCraft IIの方が複雑で、より現実世界に近い環境で繰り広げられる対戦だと認識されているからだ。

 StarCraft IIはSFを題材にした戦略ゲームで、プレーヤーは数百のユニット(駒)にリアルタイムに指示を出して、相手のユニットを攻撃していく。トッププレーヤーは1分間に300回以上の指示をユニットに送りながら、約1時間の対戦を繰り広げていく。囲碁や将棋のようなターン制ではない。

 囲碁や将棋は盤上を見渡して相手の石や駒がどこにあるのかすべて把握できる。それに対してStarCraft IIの場合は、プレーヤーはマップの一部を「カメラ」を通じて見ているだけだ。しかも味方ユニットが存在する周辺以外は相手の情報が見えない。プレーヤーは限られた情報に基づいて次の1手を考える必要がある。

 さらにStarCraft IIのユニットには相手を攻撃する戦闘ユニットだけでなく、マップ上の資源を収集してユニットや建物を生産する労働者ユニットなど様々な種類がある。加えて「絶対的に強いユニット」は存在せず、ユニットの種類に応じてグー・チョキ・パーのような力関係がある。プレーヤーは短期的な攻撃プランといった「ミクロ」の戦略と同時に、長期的なユニット生産計画といった「マクロ」の戦略も考慮する必要がある。

選択肢は10の26乗、それを毎分300回選択

 登場するエイリアンには3つの種族があって、それぞれユニットの種類も変わってくる。対戦するマップにも様々な種類がある。StarCraft IIはユニットの種類や数に加えてユニットに対して出す指示の種類も多いため、プレーヤーによる指示の選択肢は毎回「10の26乗」にも達する。10の26乗の選択肢から1つを選ぶという操作を1分間で300回以上、1時間で1万8000回以上も繰り返すのだから、対戦の間に選び得る選択肢の総数(探索空間)は天文学的な数になる。

 しかもAlphaStarは人間のプレーヤーと対等な条件で対戦する。入力する情報はゲーム内のカメラから得られる視覚情報だけで、1分間に出せる指示の回数も280回と決まっている。実は過去にStarCraft IIで人間のプレーヤーと対戦してきたAIは、マップ全体を見渡せたり、1分間に数万回の指示を出せたりするなどの「ズル」が許されていた。それでも人間に勝てなかった。これに対してAlphaStarはズルをせず人間のトッププレーヤーに勝利している。