PR

 コンピューターを使って、ある言語から別の言語に自動翻訳すること。ある言語のテキストを入力すると別の言語に翻訳するWebサービス、特許庁における特許文献の翻訳システム、音声での会話を翻訳するスマートフォン用サービスなどに使われている。

 機械翻訳の手法は主に二つに分かれる。言語のルールに基づいて文章を解析して翻訳する手法と、対訳データを学習させて統計的に翻訳する手法である。両者を組み合わせたハイブリッド型もある。

 機械翻訳をより正確で自然なものにするためのポイントは、地道な取り組みにあるとされる。まず統計的な機械翻訳では、多分野にわたる対訳データをどれだけ集められるかが重要だ。言語は日常会話、ニュース、法律、医学などの分野ごとに表現が異なり、各分野の対訳で学習する必要があるためである。言語のルールや辞書などに基づく翻訳モデルも、分野ごとにチューニングする必要がある。こうした取り組みを、言語の組み合わせの数だけ繰り返すことになる。

 機械翻訳の精度が人にストレスや誤解を与えない程度まで向上すれば、これまで言語の壁に阻まれて広がらなかった文書を世界中の人が読めるようになったり、自分が最も理解できる言語で海外の人と自然にコミュニケーションできるようになったりするだろう。個人の生活や企業の業務をガラリと変える可能性がある。