PR
[画像のクリックで拡大表示]

 富士通研究所(本社川崎市)は,富士通研究開発中心公司と共同で,文書をデジタルカメラで斜め方向から撮影した際に生じる画像のひずみ(透視ひずみ)を高速で補正する技術を開発した。透視ひずみとは,長方形の書面を斜め方向から撮影した場合に書面が長方形として撮影できないひずみのこと。書面の輪郭がなくても文字が並ぶ方向を手掛かりに補正できる点が同技術の特徴である。同技術を用いることで,看板や時刻表,ホワイトボートなどを,輪郭を含めずに部分的に斜め方向から撮影しても,あたかも真正面から撮影したように画像の文書を読みやすく補正できるという。同社は今後,同技術のコンパクト・デジタルカメラなどへの搭載を目指す。

 今回開発した技術では,文書中に整列した状態で記載されている文字や罫線の並び方や方向を拠り所に消失点の位置を推定する(図)。消失点とは,もともと平行であるはずの複数の線分が,撮影した画像の中で透視ひずみによって非平行となった場合に,それらを延長して得られる交点のこと。同技術では,垂直方向の消失点の検出において,文字の並び方だけでなく漢字に含まれる垂直方向のストロークの情報を使用することで,検出の精度を高めている。

 また,デジタルカメラなどへの搭載に向けて重要とされる補正の高速化にも尽力。透視ひずみの補正具合を粗調整から微調整へと段階的に切り替え,十分な補正精度が得られた時点で補正処理を終了するという工夫を盛り込んだ。これにより,演算を必要最小限に抑えられ,処理時間の短縮,すなわち補正の高速化が可能となったという。100万画素の画像を補正するのに必要な時間は,MPUとして「Pentium4」(クロック周波数は2.6GHz)を搭載する一般的なパソコンを使った場合で0.1秒程度という。処理アルゴリズムとしては,高速・低精度と低速・高精度の2種類のものを用意し,これらを組み合わせて使っているとしている。