PR

 チャットボット「りんな」を開発するrinnaは2022年9月9日、日本語に特化した画像生成モデルである「Japanese Stable Diffusion」をオープンソースとして公開した。英Stability AI(スタビリティーAI)の「Stable Diffusion」を、1億枚の日本語のキャプション付き画像で追加学習した。

 ユーザーが日本語の文章をJapanese Stable Diffusionに与えると、その内容に基づいた画像が出力される。日本語のキャプション付き画像を追加学習させることで、日本語の固有名詞や「キラキラ」といったオノマトペ(擬態語や擬音語)を含む文章を使って画像生成ができるようになった。

Japanese Stable Diffusionによる出力サンプル
Japanese Stable Diffusionによる出力サンプル
出所:rinna
[画像のクリックで拡大表示]

 rinnaはトレーニング済みの機械学習モデルを「Hugging Face」や「GitHub」で公開しており、これをパソコンやクラウド環境などに導入すれば、Japanese Stable Diffusionが利用できる。またrinnaは同社が運営するオンラインサービスである「キャラる」のほか、「Twitter」「Discord」に設けたアカウントやチャンネルなどにもJapanese Stable Diffusionを実装した。ユーザーはJapanese Stable Diffusionを自ら稼働しなくても、rinnaが運営するボットなどに対して日本語の文章を送信するだけで、日本語による画像生成を試せる。