PR

 人間のように経験と知識に基づいて問題を解決する仕組みを、コンピュータで実現すること。膨大なビッグデータから有効な情報を見つけ出すシステムへの応用が期待されている。

 2011年2月16日、米国のクイズ番組「Jeopardy!」で、コンピュータがクイズ王に勝利しました。そのコンピュータは、米IBMが2007年から開発を進めてきた質問応答システム「Watson(ワトソン)」です。

 Watsonの特徴は、最適な解答を、過去の経験や知識に基づいて自ら見つけ出すことです。これは、人がクイズを解く過程に似ています。人はクイズに出題されそうな情報を事前に新聞や本、ネットなどから収集。それらの情報から正解を推測し、最適な解答を選び出します。

 このように人が経験や知識などに基づいて行動することを「認知」と呼びます。実はWatsonは認知力を持ったコンピュータで、こうしたコンピュータの利用を「コグニティブ(認知型)・コンピューティング」と呼びます。ビッグデータ分析に不可欠な技術として注目されています。

仕組み:過去問で学習して精度向上

 Watsonはニュース記事や百科事典、聖書、歌詞などの膨大なテキストデータを、解答の情報源として事前に読み込んでいます。問題が出題されると、Watsonは問題文を解析して解答すべきことや解答の手掛かりを抽出し、大量の情報源のなかから解答の「候補」を列挙します。

 次に、列挙した解答が候補となる「根拠」を、その解答を導いた情報源のなかから見つけます。クイズで出題される質問文は、解答に対する説明文になっているはず。このため、解答を導いた情報源にも、質問文で説明されている内容に近いことが記述されている可能性があります。これを瞬時に検証するのです。正解に近づくには、1つの情報源から多数の根拠を見つける必要があります。

 続いて、見つけた根拠を重み付けします。正解につながりやすい解答の候補の根拠ほど、比重を大きくします。重み付けは、Jeopardy!で過去に出題された約2万5000件の問題文とその解答のデータを利用し、機械学習の手法で計算します。1つの情報源から見つかった全ての根拠の重みを足し合わせて、その解答の候補の「確信度」とします。

 この確信度がしきい値を超えたとき、Watsonはクイズの解答ボタンを“押し”て解答するのです。出題されてから解答するまでの時間は、ほぼ3秒以内という短さです。