生成AI(人工知能)を活用し、人に指示するように直感的にロボットを制御する。そんな技術の実現に向けた取り組みが盛んになってきた。プログラミングの知識やロボット技術に詳しくなくても、現場で手軽にロボットを操作できる時代が到来しそうだ。
2023年2月、米Microsoft(マイクロソフト)は対話AI「ChatGPT」をロボット制御に活用する研究成果を発表した。まだ初期段階だが、今回の成果は生成AIやその基盤技術である巨大言語モデル(LLM)をロボット制御に生かせることを示した。
ChatGPTや、その基になったGPT-3(パラメーター数は1750億)のように、ある規模にまで巨大化した言語モデル(LLM:Large Language Model)であれば、入力する「プロンプト」を工夫することで、再学習することなく、新しい別のタスクに対応できるようになる。その応用先の1つとして想定されるのが、ロボット制御だ。
今回マイクロソフトは、ドローンやロボットアームの制御に必要なコード生成にChatGPTを活用した。人が指示を出すなどChatGPTとのやり取りを通じて、ドローンやロボットアームを制御するコードを生成できる。
ドローンの場合、障害物を避けながら目的地まで飛行したり、指定した物体のそばまで飛行したりする。指示があいまいだと、ChatGPTが質問してくるので、それに返答する、というやり取りを繰り返すと、いずれ所望の行動を行うためのコードを生成する。シミュレーター上では、ドローンを制御して構造物(風力発電システムのタービン)の検査まで実施していた。
こうした一連の成果は、主に4つの段階を経て実現している。①API(アプリケーション・プログラミング・インターフェース)ライブラリの用意、②プロンプトの作成、③生成されたコードの検証、④コードのデプロイ、である。