PR
図1 高ロバスト性に向けた工夫点(発表資料から)
図1 高ロバスト性に向けた工夫点(発表資料から)
[画像のクリックで拡大表示]
図2 実証実験の構成(発表資料から)
図2 実証実験の構成(発表資料から)
[画像のクリックで拡大表示]

 日本電信電話(NTT)は2008年4月22日,インターネット上の投稿コンテンツなどの音声・映像クリップの中にあらかじめ登録された特定の音楽や映像が含まれるかどうかを高速に検出できる「ロバストメディア探索(RMS: Robust Media Search)技術」を開発したと発表した(発表資料)。音や映像の特徴同士を照合させて,特定のコンテンツを検出する。インターネット上での著作物使用のモニタリングを行う米BayTSP社と共同で,インターネット上の投稿サイトやブログなどで使用された音楽や映像コンテンツのタイトルを特定する実証実験を2008年4月22日から同年9月30日までの予定で実施する。

 今回の検出技術は,NTTのコミュニケーション科学基礎研究所が手がけてきたものである。同研究所ではこれまで,音や映像の短い断片の中に特定の音や映像が含まれているかどうかを高速に判定する技術(メディア探索技術)の研究を進めてきた。今回の実証実験では,この研究成果を用いる。

 一般に,音や映像信号の断片を探索キーとし,多数の音楽や映像を格納したデータベースの中から検索し一致するものを見つけ出すことで,そのタイトルなどの情報を引き出す技術をメディア探索技術と呼ぶ。NTTの研究所が開発した技術は,音や映像の信号に様々な変化(別の音の重なり,テロップなどの重なり,音質や画質の劣化,編集や加工など)が加わっても精度良く元のコンテンツを特定でき,ロバスト性が高いという(図1)。

 さらに今回は時間整合性フィルタ技術を開発,特徴データのサイズを圧縮した。この結果,特徴照合部の処理を大幅に高速化でき,大量の投稿コンテンツを対象とする実証実験が可能になったという。

 実証実験では,まずBayTSP社が権利者から預託を受けた音楽や映像のコンテンツに対して,NTTの研究所がRMS技術(特徴抽出部)により特徴データに変換する処理を行い,データベースに格納する。BayTSP社は,実在の投稿サイトやブログに投稿・掲示されたメディアファイルの一部を収集する。NTTの研究所が特徴データに変換し,RMS技術によりデータベースに蓄積された特徴データを探索して,その結果をBayTSP社に返信する(図2)。この実験では,1日当たり数千から数万件規模のファイルに対して,データベースとの照合を行うことを予定している。