PR
「聞いて見て楽しいブログ」
「聞いて見て楽しいブログ」
[画像のクリックで拡大表示]

 NECは,文章のテキスト・データから筆者の気持ちを推定し,その気持ちに合わせた音声を合成して読み上げたり,文字飾りなどを自動生成したりする技術を開発したと発表した(発表資料)。自動の文字装飾や音声による読み上げが可能なブログを,携帯電話機から作成するシステムなどへの活用を想定する。

 今回開発した技術は,テキスト・データを解析し,文章に込められた筆者の気持ちがポジティブかネガティブかを推定する「マインド判定技術」と,解析した気持ちに合わせて合成音声の特性(トーン)を多様に変更できる「可変トーン音声合成技術」の二つ。マインド判定技術は,「楽しい」「悔しい」など直接的な感情を表す語句が含まれた文章に加え,これらの語句が文章に含まれていない場合でも,筆者の気持ちを推定できる特徴を持つ。NECが以前から開発している「評判抽出技術」を応用した。評判抽出技術は,「高い」「小さい」のような文章中の評価表現の評価対象を特定できる技術である。

 可変トーン音声合成技術は,文章を読み上げる速さや声の高さ/太さ/明るさといった,話者のトーンを表すパラメータを大きく変更しても,滑らかな音声を合成できる技術。マインド判定技術によって推定した筆者の気持ちに合わせて音声を合成し,文章を読み上げる。

 加えてNECは,今回開発した技術を応用して,「聞いて見て楽しいブログ」の作成システムを開発したと発表した。聞いて見て楽しいブログは,携帯電話機から音声メッセージと写真をメールで送信するだけで,文字飾りを自動で付けるといった多彩な表現をしてくれるブログ。音声合成による読み上げ機能も持つ。同システムは,1)携帯電話機から投稿されたブログ用の音声メッセージを音声認識技術によってテキスト・データへ変換,2)テキスト・データからブログの筆者の気持ちをマインド判定技術により推定,3)推定した気持ちをもとにテキスト・データを読み上げる音声の特性やブログの文字色/大きさ,挿入する絵文字を自動設定するという手順を踏んで,多彩な表現のブログを作成する。

 NECは,今回開発した技術の早期の実用化を目指し,研究開発を進める。同技術は,携帯電話機からのブログの投稿だけでなく,表現力やエンターテインメント性の高いコンテンツを必要とするさまざまなサービスにも適用可能という。