PR
NECグループのブース 上部の画面には「EuphoMagic」の概要が表示されている。Tech-On!が撮影。画面内などはNECのデータ。
NECグループのブース 上部の画面には「EuphoMagic」の概要が表示されている。Tech-On!が撮影。画面内などはNECのデータ。
[画像のクリックで拡大表示]
今回の技術の概要(画面内) Tech-On!が撮影。画面内などはNECのデータ。手前に写っているスマホで技術の効果を確認できる。
今回の技術の概要(画面内) Tech-On!が撮影。画面内などはNECのデータ。手前に写っているスマホで技術の効果を確認できる。
[画像のクリックで拡大表示]

 NECは、同社の音響信号処理技術「EuphoMagic」の1つとして、風切音やタップなどの操作による雑音を1マイクで低減する技術を開発した(ニュース・リリース)。東京ビッグサイトで開催中の「ESEC 2013/組込みシステム開発技術展」(2013年5月10日まで)のNECグループのブースで、同技術のデモンストレーションを行っている。

 この技術を使うことで、屋外での携帯電話機やスマートフォンを用いた通話やビデオカメラなどでの撮影(録音)において、風や操作で生じる雑音を抑圧しながら、自然な音声での通話や録音を可能にするという。ブースの説明員によれば、こうした雑音を除去する機能を搭載した機器は市場にあるものの、雑音の周波数をばっさり落としてしまうため、音声も小さくなってしまうという難点があった。

 一方、今回開発した技術では、雑音だけを圧縮できるため、音声が聞き取りやすくなったり、きれいに録音できたりする。ブースではスマートフォンにこの技術を搭載してデモンストレーションを行っている。同技術をオンオフできるため、実際に聞いてその効果を確かめられる。NECによれば、スマートフォンのような演算能力が限られた機器でも、今回の技術が有効に稼働することから、さまざまな機器に応用可能だという。

定常雑音と非定常雑音の組み合わせと捉える

 風切音を例にしたときの今回の技術の内容は以下の通りである。風切音が、風から発生する一定の雑音(定常雑音)と風の強弱により変動する雑音(非定常雑音)から構成されると捉え、それぞれを適切に抑圧する。このように、風の特性や強さに柔軟に対応し、風切音のみを抑圧する技術は、世界初だとNECはいう。

 定常雑音は入力信号(マイクに入ってくる音)に音声がないときの平均値によって推定し、非定常雑音は入力信号と定常雑音推定値との差によって推定する。これらの推定値を入力信号から除去している。また、非定常雑音として誤検出されやすい、音声が急に大きくなる部分は、構成する周波数の波形の大きさに基づいて識別している。具体的には、複数の異なる周波数における波形の大きさのバラツキを用い、バラツキが大きいものが音声、小さいものが非定常雑音と判断するという。

 さらに、今回、次のような演算量を削減する工夫を施した。すなわち、入力信号を複数の異なる周波数に分解・合成する処理を、周囲雑音(環境雑音)の抑圧と風切音の抑圧で共通化した。それぞれの処理を別々に行う方法と比べて演算量を約3割削減し、演算能力が限られるスマートフォンのような機器でも遅延のない処理を実現したという。