PR

 米Google(グーグル)は2023年3月14日(米国時間)、テキストや画像、音声、動画などを生成するAI(人工知能)のクラウドサービスをGoogle Cloudに追加すると発表した。巨大言語モデル「PaLM」の機能を提供するAPI(アプリケーション・プログラミング・インターフェース)などのほか、GmailやDocsなどのSaaS(ソフトウエア・アズ・ア・サービス)にも生成AI機能を追加する。

 今回APIでの提供が発表されたPaLMはグーグルが2022年4月に発表した巨大言語モデルだ。ユーザー企業はPaLM APIを呼び出すことによって、学習済みのPaLMが備える文章生成や会話、要約、分類といった様々な生成AIの能力を利用できる。

 PaLMのニューラルネットワークの規模は最大5400億パラメーターであり、米OpenAI(オープンAI)の巨大言語モデル「GPT-3」の最大1750億パラメーターを上回る。巨大言語モデルはパラメーターの数が多いほど性能が向上するとされている。ただし当初公開されるPaLM APIは「効率的なモデル」(Google Cloudのトーマス・クリアンCEO=最高経営責任者)になるとしており、5400億パラメーターには及ばないサイズのモデルが公開されるようだ。他のサイズのモデルは後日公開するとした。

DeepMindのマルチモーダル基盤モデルも利用可能に

 Google Cloudの機械学習プラットフォーム「Vertex AI」では、グーグルや兄弟会社の英DeepMind(ディープマインド)が開発したPaLM以外の巨大言語モデルや、テキストに加えて画像や音声、動画、ソースコードなどが生成できるマルチモーダルな基盤モデルが利用可能になる。ユーザー企業はVertex AIを使って、学習済みの基盤モデルをカスタマイズしたり、基盤モデルの推論処理をGoogle Cloud上で実行したりできる。

 同時にグーグルは、基盤モデルの持つ生成AIの能力を組み込んだ会話ボットやチャットアプリ、デジタルアシスタント、検索エンジンなどが開発できるツールである「Generative AI App Builder」も提供する。

Google Workspaceにも生成AIを搭載

 GmailやDocsなどで構成するSaaSであるGoogle Workspaceにも、生成AIの機能を追加する。例えばGmailであれば、ユーザーがメールの内容を箇条書きするだけで、丁寧な本文を生成する。受信したメールの内容を要約することも可能だ。

 Docsであれば、生成AIをブレーンストーミングに活用したり、ユーザーが入力した文章の校正に使用したりできる。プレゼンテーションソフトのSlidesにはテキストから画像や音声、動画を生成する機能、会議ツールのMeetには背景を自動的に生成する機能や音声をテキストに変換する機能などをそれぞれ搭載する。

 巨大言語モデルのクラウドサービスは、米Microsoft(マイクロソフト)がMicrosoft Azureで提供する「Azure OpenAI Service」で先行した。マイクロソフトは2023年1月に、Azure OpenAI Serviceの一般提供を開始した。マイクロソフトがオープンAIの言語モデルをサービスとして提供するのに対して、グーグルは自社グループが開発した巨大言語モデルの提供で追い上げを図る。