全6690文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 拡散モデルはDALL·E 2やStable DiffusionやMidjourneyなどテキストから画像を生成する際に使われるモデルとして有名となった。拡散モデルはデータに徐々にノイズを加えていき、完全なノイズになる過程を逆向きにたどる逆拡散過程によって、ノイズ分布からデータ分布への生成過程を定義する。生成タスクだけでなく制御や敵対的摂動対策など幅広い問題に使われるようになっている。

著者の岡野原大輔氏
著者の岡野原大輔氏
[画像のクリックで拡大表示]

 この生成モデルは拡散過程が固定の認識モデル、逆拡散過程が生成モデルに対応する潜在変数モデルとみなすことができる。そのため拡散過程以外の過程を使うことで、より効率的に学習やサンプリングができたり、別の帰納バイアスを導入できるのではないかと考えられていた。