PR

 日立製作所は,騒音の中でも特定の人の声を聞き分けることが可能な音源分離技術を開発したと発表した(発表資料)。複数のマイクを用いて,2段階の雑音抑制処理によって実現した。まず,部屋の壁や天井の反射で発生する雑音を予測・除去することによって目的の音声を抽出し,その後抽出した音声の歪み補正処理を行う。従来に比べて感度を2ケタ高められるほか,マイクから数m離れた人の声を周囲の音と分離することや,音声の発生位置を特定することが可能になるという。テレビ会議システムや,騒音の中から異常音を検知する音響監視システムなどへの応用を想定する。

 従来の音源分離技術は,抽出したい音源位置の方向を特定し,それ以外の方向からの音を除去することによって,目的の音声を抽出していた。このため,マイクと音源の距離が数メートル離れると,室内での音の反射によって音源の方向を特定する精度が劣化し,雑音を充分に除去できないという課題があったという。

 4m四方の室内にマイクを16個設置して,今回開発した技術の評価実験を行ったところ,約10秒で目的の音声を抽出し,雑音を約20dBに抑えられたとする。これは,雑音の音量を1/100程度に低減したことを意味するという。さらに,音源の位置を誤差20cm以内の精度で特定できることも確認した。

 具体的な音声処理に関しては以下の通り。一段階目の雑音の除去では,一つのマイクの入力信号(入力信号1)に混入する雑音信号を,他のマイクの信号に混入する雑音信号から推定し,推定した雑音信号を入力信号1から差し引くことで,雑音を除去した信号を得る。すべてのマイクの入力信号に対してこの処理を行い,雑音信号を除去した信号を得る。しかし,この段階では上記の処理によって一部の音が欠け,目的の音も若干歪んだ音となっているため,2段階目の歪み補正処理を行う。歪み補正処理では,それぞれのマイクに含まれる目的の音の断片を寄せ集めて,原音に近いきれいな音に補正できるという。