全5602文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 ビジョンやロボティクスタスクにおいて姿勢推定は重要なタスクである。複数の異なる視点での観測から、各観測時のカメラの位置姿勢(以下姿勢)を推定することで現在の状態を推定したり3次元復元などの幾何認識を実現できる。

 姿勢推定の最適化問題は最適化が難しく、かつ計算量が非常に大きいことが知られている。初期値をかなりうまく取らなければ局所解に収束し、推定が失敗する。また、推定が成功しているかも保障できないことが大きな問題であった。問題の性質から最適解を求めることは不可能と考えられていた。

著者の岡野原大輔氏
著者の岡野原大輔氏

 その姿勢推定においてRotation Averagingとよばれる技術が注目されている。これは複数の観測間の相対回転姿勢の推定結果が与えられた時、全観測の絶対回転姿勢、どの方向を向いていたかを推定する問題である1)。姿勢は回転成分と並行移動成分から成るが、そのうち回転成分だけを先に推定するというものだ。回転成分が決定されれば、並行移動成分は比較的容易に推定できる(損失を選べば凸最適化問題として解ける)。また、2つの観測間の相対回転姿勢は、共通する特徴点から基本行列を推定し、その固有値分解を行うことで推定できる。ただRotation Averaging自体も難しい問題と考えられていた。

 2018年にオーストラリアQueensland University of TechnologyのAnders Eriksson氏らはRotation Averagingは相対回転姿勢の推定結果が一定以下のノイズしか含まれない場合は(初期値に依存せず)絶対姿勢の最適解を求めることができ、また最適性保障ができることを示した2-3)。姿勢推定において大きな前進であり、実際提案手法は従来手法に比べはるかに正確な姿勢を与えることができた。しかし実用的には入力数が増えるにつれ計算量が急激に大きくなり、数百点程度までしか現実的な時間で求めることができず広く使われることがなかった。