全7364文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 大手産業用ロボットメーカーの三菱電機が、ロボット向けの強化学習で高い性能を実現する新手法を開発した。

 既存の深層強化学習アルゴリズムに、三菱電機が考案したモジュールをアドオン(付加)すると、タスクの性能を最大で1.5倍ほど向上させ、学習効率も大幅に向上できた。

 2020年7月に開催された機械学習分野のトップカンファレンス「ICML(International Conference on Machine Learning)2020」で発表した。現時点ではまだシミュレータ上で手法の有効性を確認した段階だが、将来的に自社の産業用ロボットに適用することを視野に入れている(図1)。同社によれば、カメラ画像を直接入力するのではなく状態量のみを入力するタイプの手法としては「世界最高性能を実現できた」という。

図1 ロボット向けの強化学習手法で新アルゴリズムを考案
図1 ロボット向けの強化学習手法で新アルゴリズムを考案
三菱電機は産業用ロボット向けに、強化学習の性能を向上できる新アルゴリズムを考案した。将来的に自社のロボットに適用することを狙う。写真は、今回の技術の適用結果ではなく、2019年に発表した、強化学習技術を用いて軌道を最適化する同社技術の実演の様子。
[画像のクリックで拡大表示]

 今回の三菱電機の技術の最大のインパクトは、強化学習においてこれまで漠然と信じられてきた通説を覆し、新たな知見を見出したことである。また、既存のどのような深層強化学習アルゴリズムとも組み合わせることができ、非常に汎用的に利用できるという利点を備える1)