全3836文字
PR

 一般道を対象にした「レベル3」以上の自動運転を実現するには、運転操作の「認知」、「判断」、「操作」のプロセスを高度化する必要がある。このうち今回は、判断のプロセスに焦点を当て、機械学習などのAI(人工知能)技術を活用して「判断」のプロセスを高度化するためのアプローチについて、デンソーが解説する。(日経 xTECH編集部)

 本稿では、運転の基本動作である「認知」、「判断」、「操作」のうち「判断」に焦点を当て、自律的に機能を獲得・改善するための機械学習の手法と、それを実際に適用するためのアプローチについて解説する。

より複雑なシーンへの対応

 デンソーが提案する自動運転アルゴリズム「ROIP(RObust Intelligent Planner)」は、周囲の状況に基づいて車両の目標軌道を自動で判断・出力するものである(関連記事)。高速道路で合流を行う例では、自車や他車の位置・速度、合流車線終端までの距離といった情報が判断の材料となる。高速道路は道路形状が比較的シンプルで、交通参加者(車両や二輪車など)の動きもある程度限定されることから、判断の材料となる情報の設定が比較的行いやすい。

 ところが、自動運転のシーンを一般道へ広げると、考慮すべき周囲の状況は非常に複雑になる。歩行者や自転車、信号、交差点のように状況を表す要素の数が増えると、状況変化の分岐数が非常に多くなる。「枝刈り」注)などの手法を駆使しても、実時間では解けないくらい計算時間が長くなってしまう。

注)デンソーが提案するROIPでは、他車の行動予測結果を生かして各行動分岐の実現可能性を確率で測り、「起こり得ない」もしくは「起こる可能性が低い」パターンを削除する。この処理を一般的に「枝刈り」と呼ぶ。

 周囲の状況が判断に与える影響を精査し、必要な要素だけに絞ることができれば計算時間を短縮できる可能性がある。しかし、各要素と判断の良しあしの関係は交通シーンによって変化するため、このアプローチは限られたシーンのみで有効である。複雑なシーンに対応するには、何らかの自動化手法が必要になると思われる。

 周囲の状況と判断の良しあしの関係を人手によって明示的に把握できない場合でも、データから自動的に学習できる手法として「深層強化学習(Deep Reinforcement Learning)」が注目されている。深層強化学習とは「深層学習(Deep Learning)」の特徴量抽出能力と、「強化学習(Reinforcement Learning)」の汎用的な最適化能力を融合させた手法である。

 極端に言えば、目的地を設定し複雑な周囲の状況をそのまま入力するだけで、良しあしに関わる要素を自動で取捨選択しながら最適な判断を行う技術である。実際には、「深層Q学習(Deep Q-Learning)」や「AlphaGo」のように、タスクに応じて様々な工夫が必要になるが、従来の手法よりも高いポテンシャルを秘めているという期待から脚光を浴びている。