全7239文字
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
ディープニューラルネット(DNN)を使って生成モデルを構成する有力技術の1つ、変分オートエンコーダ(VAE)をそのまま使いながら、これまで難しかった定量的な分析を可能にする方法を富士通と東京大学、理化学研究所の革新知能統合研究センター(AIP)が共同で開発した。
入力データ自体の確率分布の推定や、VAEで求めた潜在変数の重要度の定量評価などができるようになる(図1 )。数学的な理論に基づき通常のVAEの出力を利用して解析するため、基本的にVAEの構成や学習方法を変更する必要はない。
図1 VAEの活用範囲を拡大
生成モデルとして利用されるVAEやGANは、図(a)(b)に示した構成で学習させることで、入力データによく似たサンプルデータを生成可能になる。学習後の潜在変数(事前に設定した確率分布に従う)とニューラルネット(図のデコーダや生成器)の組み合わせが、入力データを生成する確率分布に相当すると考えられるためである。ただしこれらの手法では、入力データを生成する確率分布自体は明示的には表現されず、潜在変数と生成されるデータの間の関係も不明瞭だった。このため特定のデータが生成される確率の計算や、潜在変数の重要度の比較といった、定量的な挙動の評価は困難だった。富士通研究所が開発した「DeepTwin」は、入力データと潜在変数の間に等長埋め込み(isometric embedding)と呼ぶ関係を保つことで、入力データの確率分布の推定などを可能にし、VAEやGANの制約を取り払った。今回、富士通と東京大学、理化学研究所はDeepTwinの発想を応用して、既存のVAEを使いながら、入力データの確率分布の推定や潜在変数の重要度の推定などを可能にする手法を開発した。(表:富士通の資料を基に加筆)
[画像のクリックで拡大表示]
この技術を応用することで、例えば獲得したデータの生起確率を見積もり、その高低によって正常か異常かを判断するといった応用が可能になる。実際、富士通らは異常検知用の公開データセットを使って、通常のVAEのままで最高水準の検知性能を達成できることを示した(詳しくは後述)。これらの成果を2021年7月開催の「ICML2021(The Thirty-eighth International Conference on Machine Learning)」で発表した1) 。
この記事は日経Robotics購読者限定です。次ページでログインまたはお申し込みください。
次ページ 生成モデルは、学習時に入力したデ…