全1924文字
PR

 ZoomやTeamsなどでビデオ会議をしている最中、参加者の眼鏡の反射光が気になったことはないだろうか。パソコンの画面などが、眼鏡のレンズに反射して映り込むことがある。

 この反射光をうまく捉えれば、相手のパソコンに表示されている情報を盗み見できるのではないだろうか――。米ミシガン大学と中国の浙江大学の研究者グループはこの可能性を調べるために実験を繰り返した。

予備実験の模様。(a)マネキンに眼鏡をかけさせてパソコンの前に座らせ、(b)ノートパソコン内蔵Webカメラ(720p)、(c)外付けWebカメラ(1080p)、(d)デジタル一眼レフカメラ(4K)それぞれで撮影した
予備実験の模様。(a)マネキンに眼鏡をかけさせてパソコンの前に座らせ、(b)ノートパソコン内蔵Webカメラ(720p)、(c)外付けWebカメラ(1080p)、(d)デジタル一眼レフカメラ(4K)それぞれで撮影した
(出所:論文「Private Eye: On the Limits of Textual Screen Peeking via Eyeglass Reflections in Video Conferencing」)
[画像のクリックで拡大表示]

 眼鏡をかけている人、特にビデオ会議中に趣味のWebサイトなどを見ている人にとっては気になるところだ。さて、実際どうなのだろか。

実験室なら10mmの文字を75%超で識別

 まずは理想的な実験環境を構築して、眼鏡に映り込んだ小さい文字をビデオ会議経由で識別できるかどうかを調べた。ビデオ会議ツールにはZoomを使用した。

 眼鏡をかけた被験者をノートパソコンの前に座らせて、大きさの異なるアルファベット大文字(文字の縦の長さが7~20mm)を1文字表示させる。被験者とビデオ会議をしている研究者は、被験者の映像を3秒間録画。映像から8フレームを抜き出して、眼鏡に映り込んだ画像を再構成した。

 画像の文字の識別には、クラウドソーシングサービスのAmazon Mechanical Turk(MTurk)を使用した。同サービスで25人に依頼し、目視により画像がどの文字に見えるかを判定してもらった。そしてその正解率を識別率とした。

実験のイメージ。マネキンがかけた眼鏡に、画面に表示された「A」が映り込んでいる
実験のイメージ。マネキンがかけた眼鏡に、画面に表示された「A」が映り込んでいる
(出所:論文「Private Eye: On the Limits of Textual Screen Peeking via Eyeglass Reflections in Video Conferencing」)
[画像のクリックで拡大表示]

 評価の結果、720p(1280×720画素)のWebカメラで、縦10mmの文字を75%以上の精度で識別できたという。

1文字を識別する実験の結果。「MTurk」はクラウドソーシングを利用した人手による評価、「CRNN」は文字認識システムによる評価
1文字を識別する実験の結果。「MTurk」はクラウドソーシングを利用した人手による評価、「CRNN」は文字認識システムによる評価
(出所:論文「Private Eye: On the Limits of Textual Screen Peeking via Eyeglass Reflections in Video Conferencing」)
[画像のクリックで拡大表示]

実環境では20人中6人が識別率0%

 次に実際のビデオ会議で盗み見が可能かどうかを調べた。具体的には20人の被験者に、自分の部屋から自分のパソコンでビデオ会議に参加してもらった。そしてそれぞれのパソコンで、研究者が配布したHTMLファイルを表示させた。HTMLファイルには、7個から9個の英単語で構成されたニュース記事の見出しが含まれている。

 1つのHTMLファイルにつき30秒間映像を記録し、その映像から眼鏡に反射した見出しを識別する。なおビデオ会議経由だけではなく、それぞれの被験者の部屋に設置したビデオカメラでも録画した。

 さて結果だが、20人中6人については文字の大きさにかかわらず識別できなかった。

 縦35mmの文字で構成された見出しについては、ビデオカメラによる録画では4人、ビデオ会議経由による録画では3人が識別率100%だった。

 だが10mmの文字では識別率は大きく下がる。ビデオ会議経由による録画ではたった1人だけが識別できたが、それでも識別率は12.5%だった。実環境では、前述の実験室環境のようにはいかないようだ。

見出しを識別する実験の結果。上がビデオカメラ、下がビデオ会議経由による録画。文字の大きさはS1が7.4mm、S2が10mm、S3が14mm、S4が18mm、S5が35mm、S6が60mm
見出しを識別する実験の結果。上がビデオカメラ、下がビデオ会議経由による録画。文字の大きさはS1が7.4mm、S2が10mm、S3が14mm、S4が18mm、S5が35mm、S6が60mm
(出所:論文「Private Eye: On the Limits of Textual Screen Peeking via Eyeglass Reflections in Video Conferencing」)
[画像のクリックで拡大表示]