全2497文字
PR

 米Google(グーグル)は、開発者会議「Google I/O 2021」で、研究開発中の新しいAI(人工知能)技術を発表した。自然な会話が可能になる「LaMDA(Language Model for Dialogue Applications)」と、より高度な検索が可能になる「MUM(Multitask Unified Model)」である。同社 CEO(最高経営責任者)のSundar Pichai(スンダー・ピチャイ)氏らが登壇した基調講演では、擬人化した「冥王星」や「紙ヒコーキ」がLaMDAを利用して人と自然に会話する様子を見せた。MUMでは、ユーザーがスマートフォンで登山靴の写真を撮って、富士山の登山で使えるかどうか質問するとそれに回答するといった、高度な検索を披露した。いずれも、これまでのAIでは実現が難しかった機能で、一線を画す成果だといえる。

「Google I/O 2021」の基調講演で「LaMDA」を紹介するピチャイ氏
「Google I/O 2021」の基調講演で「LaMDA」を紹介するピチャイ氏
(出所:Google I/O 2021の基調講演の公式動画からキャプチャーしたもの)
[画像のクリックで拡大表示]
LaMDAを使い、冥王星と会話するデモを見せた
LaMDAを使い、冥王星と会話するデモを見せた
(出所:Google I/O 2021の基調講演の公式動画からキャプチャーしたもの)
[画像のクリックで拡大表示]

 LaMDAは、対話に焦点を絞った言語モデルである。ネットワークアーキテクチャー「Transformer」を利用した。同じアーキテクチャーを利用した「BERT」や「GPT-3」といった他のモデルとは、対話で学習させた点が大きく異なるという。その結果、LaMDAは、あたかも人と会話しているかのように、柔軟に話題を変えつつ、自然に話せる。人と人の会話の場合、例えば、最初は天気について話していても、最後はサッカーの話題で終わるように、開始直後の話題が転じて、異なる話題で会話が終わることがよくある。LaMDAであれば、モデルを再学習させることなくさまざまな話題に対応できるので、こうした人間同士のような会話が可能になるという。加えて、学習済みのLaMDAにファインチューニング(改良)を施せば、より「思慮深い応答」が可能になるなど、改良の余地が大きいと説明する。

 LaMDAは、あくまで研究の初期段階にあり、現在、グーグル内での利用にとどめている。それでも、LaMDAのような自然な対話機能は、「情報検索やコンピューティングをより身近にする」(ピチャイ氏)とし、いずれ「Google アシスタント」や検索エンジン、ビジネスツール群「Google Workspace(旧称:G Suite)」といったグーグル製品への搭載に向けて意欲を見せた。加えて、外部の開発者や顧客企業にLaMDAを提供する方法も検討中だとする。

 LaMDAでは現状、テキストで学習させているという。だが現実には、人はテキストだけでなく、画像や音声、動画など多様な手段でコミュニケーションを図る。そこで、さまざまな種類の情報に対応する「マルチモーダルモデル」が今後、必要になると同氏はみる。マルチモーダルモデルを実現できれば、例えば、美しい山の景色が見られるドライブルートを探索できる。ライオンの様子を撮影した動画から「夕暮れ時にライオンが雄たけびを上げている場面」を見たいとリクエストすると、動画内のその場面に瞬時に飛ぶことも可能になる。

美しい山の景色が見られるドライブルートを探索
美しい山の景色が見られるドライブルートを探索
(出所:Google I/O 2021の基調講演の公式動画からキャプチャーしたもの)
[画像のクリックで拡大表示]
ライオンの様子を撮影した動画から「夕暮れ時にライオンが雄たけびを上げている場面」に瞬時にアクセス可能
ライオンの様子を撮影した動画から「夕暮れ時にライオンが雄たけびを上げている場面」に瞬時にアクセス可能
(出所:Google I/O 2021の基調講演の公式動画からキャプチャーしたもの)
[画像のクリックで拡大表示]