全2247文字
PR

 AI(人工知能)による思考を人間が助ける「プロンプトエンジニアリング(Prompt Engineering)」が注目されている。様々な質問に答えられる最新AIの「巨大言語モデル」は、質問の仕方を工夫すると、AIによる回答の質が変わることが分かったためだ。この工夫をプロンプトエンジニアリングと呼ぶ。

 言語モデルとは、自然言語による質問応答や文書生成などができるAIである。その中でも最近登場した米OpenAI(オープンAI)のGPT-3や米Google(グーグル)のPathways Language Model(PaLM)は、あたかも人間が書いたかのような文章を出力できることで注目されている。これら最新の言語モデルはパラメーターの数が数百億~数千億にも達することから、従来の言語モデルと区別して巨大言語モデルと呼ばれる。

 巨大言語モデルに質問する際のユーザーインターフェース(UI)は、プロンプトと呼ぶ。Windows OSの「コマンドプロンプト」でおなじみの、あのプロンプトだ。人間が巨大言語モデルのプロンプトに質問文を入力すると、巨大言語モデルは回答を出力する。

例題と回答例を示すだけで、新しいタイプの質問に回答

 最新の巨大言語モデルの場合は、AIに質問をする際に、例題と回答例もプロンプトに入力する。するとAIは例題で示された回答パターンに従って、新しいタイプの質問に答えてくれるのだ。

 例えばグーグルの兄弟会社である英DeepMind(ディープマインド)が2022年4月に発表した「Flamingo」の場合、例題として動物の画像、回答例としてその動物の名前と生息場所を説明する文章をいくつか入力する。その上で質問としてフラミンゴの画像を入力すると、「これはフラミンゴです。カリブ海地域や南アメリカで見かけられます」という回答を出力する(本来の文章はすべて英語、以下同じ)。

 これはいわば「画像を分析してその動物の名前と生息場所を回答するAI」を開発しているようなものだ。しかしプログラミングは必要ない。人間はAIに対して「例題と回答例」を与えるだけでよい。

回答例に解き方を含めると、解き方に従ってAIが思考

 さらにグーグルが2022年4月に発表したPaLMの場合は、PaLMに入力する例題の回答例に、最終的な答えを出すまでの解き方を加えてやる。そうするとPaLMは、解き方も含めて答えを出力するようになる。

 興味深いことにPaLMでは、例題で示した解き方が丁寧であるほど、PaLMの解き方も丁寧になり、それによって回答もより正確になるのだ。グーグルが論文で示した例に基づいて説明しよう。