PR

 マイクロソフトのWebサイト「マイクロソフト サポート オンライン」にアクセスし「技術情報の検索」をクリックすると「サポート技術情報 (Knowledge Base:KB)」が検索できる。KBは,トラブルシューティングから,仕様の解説,操作方法など,様々な情報が含まれているため,Windowsをサポートする人間には必須のサービスだ。オリジナルのサポート技術情報は英語であるが,多くの言語に翻訳されている。翻訳されていないものは,機械翻訳されたものが自動的に表示されるので,見た人も多いだろう。

 ところで,この機械翻訳,Microsoft Researchというマイクロソフトの研究部門の成果が生かされているらしい。ちょっと(とても?)笑ってしまうものも多いが,おおむね頑張っているのではないかと思う。Windows Vistaのベータ版のヘルプも機械翻訳である。英語原文へのリンクもあるので,英語と比較しながら読むこともできる。

 実は,私,機械翻訳についてはちょっとうるさい。私の修士論文は「自然言語理解」といって,機械翻訳とは親戚関係の技術だ。当然,一通りの内容は勉強した。ちなみに,自然言語は,「プログラム言語」やエスペラント語などの「人工言語」に対応して作られた単語で,要するに「ふつうに人間がしゃべっている言語」のことである。

 機械翻訳の歴史は,1950年代にまで遡る。コンピュータ黎明期である。最初の翻訳実験は,ロシア語から英語であった。これは,ソ連(当時)が人工衛星の打ち上げに成功したことにショックを受けたからだと言われている。人工衛星を打ち上げられるということは,ソ連から米国本土までミサイル攻撃ができる可能性もあるわけで,そりゃあわてるだろう。

 ところで,機械翻訳は,昔から誤訳を笑われる宿命にある。有名なものに

Time flies like an arrow.

 を「時バエ矢を好む」と訳したというエピソードがある。本来は「時間は矢のように過ぎる」つまり「光陰矢のごとし」の意味である。しかし,笑うのはちょっと待ってほしい。Time flyというハエが存在しないことは保証できるのか?もちろん,likeが「好む」という意味なら「Time flies like arrows.」になるはずだ。しかし,単数形と複数形の間違いなど現実にはよくある話だ。では,こっちはどうだろう。

Fruit flies like a banana.

 「果物はバナナのように飛ぶ?」全然違う。これは「ショウジョウバエはバナナを好む」である。え,Fruit Flyがショウジョウバエであることを知って入ればすぐ分かる?さあ,どうだろう。山田詠美の小説「ベッド・タイム・アイズ」の冒頭「スプーンは私をかわいがるのがとてもうまい」を読んで,一瞬「スプーンとはなんだろう」と思った人は多いのではないか。さすがに匙のことだとは思わないにしても,人間の男性だと確信するまでには数行読み進む必要があったはずだ。

 修辞を多用する小説と,技術文書を一緒にしてはいけないかもしれないが,自然言語の解釈という意味ではそれほど違いはない。日本語だから問題なのではない。自然言語はどれも,同様にあいまいで複雑にできている。

 機械翻訳は,簡単な技術ではない。語彙を増やせばよいというものではない。単純に語彙の数だけを増やしすぎると精度が落ちることが実証されている。また,言語学的な文法規則は役に立たない部分も多い。すぐ実用になる気配もない。カナダでは,天気予報の英仏自動翻訳が実用化されたと学生時代に聞いたことがあるが,その後の実用例はあまり聞かない。だからこそ,研究者には努力してほしい。

 残念なこともある。実は,日本の機械翻訳技術はかなり進んでいる。京都大学では,長尾真教授が中心となって,大規模な技術論文翻訳システム作成プロジェクトが行われたし,ATR(国際電気通信基礎技術研究所)では,会話をリアルタイムで翻訳する試み(ATRのWebサイト)もある。しかし,KBの翻訳を見る限り,こうした技術が生かされているとは言えないようだ。これについては,今後に期待したい。

 マイクロソフトは,(開発ではない)研究部門を維持している数少ないIT企業である。10年先,あるいは20年先に実用化されるような,素晴らしい技術を開発してほしい。Microsoft Researchには,Googleと並んで一流の科学者とエンジニアが在席している。部分的な技術改善ではなく,ワクワクするような新技術が登場することを期待したい。

【追記】

 機械翻訳は,サポート技術情報での利用に留まらない。Windows Vistaのベータ版では,ヘルプを全面的に機械翻訳で置き換えた。従来,ヘルプの翻訳はリリースの最終段階に行われていたが,機械翻訳の採用により,早期に日本語化されたヘルプが利用できるようになった。

 ただし,機械翻訳の品質はまだまだ低い。それを補うため,英語ヘルプへのリンクが設置されている。製品版では人間が行った翻訳になるのだろうが,英語へのリンクはぜひ保存しておいて欲しい。

それから,もう1つ例文を思いついたので書いておく。

Dragon flies like lightning.