PR

 これまでこのコラムで、筆者は人工知能(AI)と人間の関係について、AIと人間との人間に都合がよい形でのすみ分けは難しいという話を何度かしてきました。すると実際、先日さまざまなニュースで取り上げられた、米Google社傘下の英DeepMind社が開発した囲碁を打つAI「AlphaGo」が、囲碁界のスター棋士に4勝1敗という成績をおさめました。この件で筆者が驚いたのは、AlphaGoが強かったことではなく、それまで「AIが囲碁でトップ級の棋士に勝つにはあと10年かかる」と信じられていた点でした。見通しが甘すぎたというほかありません。

 前回の「人工知能との戦い、人間に“安全な逃げ場”はない」では、AIと人間とを分ける「視覚の壁」が、畳み込みニューラルネットワーク(CNN)で崩れたインパクトについて触れました。最近は、AIの研究開発の次の大きなターゲットが二つ、明確になってきたように感じます。(1)深層学習と強化学習の融合、(2)自然言語、の二つです。

 (1)は、深層学習の課題が浮き彫りになってきたことに関係します。その課題とは、深層学習では、データの価値や意味とは無関係に、とにかく大量のデータを必要とする点です。一方、人間やその他の動物は、毒を誤って食べてしまうなどの大きな失敗を一度すると、その失敗を2度と繰り返さないようするなど、経験の意味付けによって学習効率が大きく変わります。毒でさえ何度も繰り返して食べないと学習できないというのでは、種の存続にかかわります。

 このデータの価値や意味によって学習効率を変化させること自体は、機械学習の世界で「強化学習」と呼ばれ、長い研究の歴史があります。それで研究者の多くが、今必要なのは深層学習と強化学習の融合だと気付き始めたのです。AlphaGoも、両者を融合、または連携させた成果の1つと言えます。