全7364文字
大手産業用ロボットメーカーの三菱電機が、ロボット向けの強化学習で高い性能を実現する新手法を開発した。
既存の深層強化学習アルゴリズムに、三菱電機が考案したモジュールをアドオン(付加)すると、タスクの性能を最大で1.5倍ほど向上させ、学習効率も大幅に向上できた。
2020年7月に開催された機械学習分野のトップカンファレンス「ICML(International Conference on Machine Learning)2020」で発表した。現時点ではまだシミュレータ上で手法の有効性を確認した段階だが、将来的に自社の産業用ロボットに適用することを視野に入れている(図1)。同社によれば、カメラ画像を直接入力するのではなく状態量のみを入力するタイプの手法としては「世界最高性能を実現できた」という。
今回の三菱電機の技術の最大のインパクトは、強化学習においてこれまで漠然と信じられてきた通説を覆し、新たな知見を見出したことである。また、既存のどのような深層強化学習アルゴリズムとも組み合わせることができ、非常に汎用的に利用できるという利点を備える1)。