PR

 グーグルは2009年12月7日、12月3日に公開した日本語入力ソフト「Google 日本語入力」に関する説明会を開催した。Web上にある大量のデータを基に辞書を生成することによる語彙(ごい)力の高さと、強力なサジェスト機能を改めてアピール。同社がオープンソースで開発を進める「Chrome OS」に対応する計画も明らかにした。ただし、変換結果として表示される言葉の正しさについては、現状では問題があることも認めた。今後、ユーザーからのフィードバックを基に改善していく計画という。

 「これはグーグルでなければ作れない日本語入力ソフトだと自負している」。主要開発メンバーである、同社ソフトウェアエンジニアの小松弘幸氏はこう話す。同ソフトは、小松氏と同じくソフトウェアエンジニアである工藤拓氏が、本来の業務とは別の取り組みとして開発を始めた。両氏は現在ではフルタイムでこのソフトの開発に携わっているが、ほかにも複数のメンバーが有志で参加しているという。こうしたメンバーの情熱と、大量のWebデータの存在、そしてグーグルが持つ計算機環境の組み合わせによって実現したソフトだと話す。

 開発の動機となったのは、検索キーワードの入力ミスを指摘する「もしかして」機能。「ミスの多くは、日本語入力ソフトの誤変換によるもの。特に新語がうまく変換できていない。にもかかわらず、我々の開発したシステムはうまく修正できる。日本語入力ソフトを作ったら便利になると確信した」(工藤氏)。「ブログなどを見ても、グーグルが日本語入力ソフトを作ってくれないかという意見は多い。こうしたユーザーにも後押しされた」(シニアエンジニアリングマネージャの及川卓也氏)。

 Google 日本語入力では、同社が収集(クロール)済みの大量のWebデータを利用して辞書を自動生成する。これにより、人手では収集が難しい新語や専門用語、芸能人の氏名などを大量に収録する。さらにどの言葉がどれくらい使われているかを解析し、データベース化。これによって、変換候補を適切にランキングできるとする。まさに「Webのありのままを反映したエンジンだ」(工藤氏)。ただ、すべてをWebデータでまかなっているわけではなく、「IPA辞書」など基本的な語彙(ごい)を網羅したオープンソースの辞書も利用しているという。

 辞書は、同社のソフトウエア更新の仕組みを利用して更新する。Google 日本語入力では辞書は実行ファイルの中に含まれているが、システムからログアウトせずに更新できるようにするという。

 同ソフトの公開後には、グーグルが開発したソフトであるため「ネットワークに接続していないと使えないのか」との問い合わせが多く寄せられたという。Google 日本語入力はパソコン上で動作するソフトで、辞書などもローカルに保存していることを改めて説明。さらにプライバシーに関しても、ダウンロードや辞書更新などの際に、利用しているOSなどの情報を送信する以外、グーグルに情報が送られることはないと強調した。ユーザーが同意した場合のみ、どの程度のキーをタイプしたかといった「使用統計情報」と、障害が発生したときの状況が記された「障害レポート」を送信する。

 デモでは、前後の単語によって同音異義語を正しく変換するなど、日本語入力ソフトとしての基本的な処理が高精度にできることを披露。その上で、「歴女」のような新語に強いこと、「とくがわ」と入力すると徳川を姓に持つ人名がずらりとサジェストされること、一度入力した語を次回以降にサジェストとして提示することなどをアピールした。さらに、サジェスト機能は無効にできることや、設定画面の「シークレットモード」を有効にすれば学習機能や入力履歴を使ったサジェスト機能などが働かなくなることなども説明した。

 時期など具体的なことは未定としながらも、Chrome OSにも対応予定という。「Chrome OSはオープンソースのOSなので、それにかかわる部分はオープンソース化する計画」(及川氏)。将来的には、日本語変換処理そのものをWebアプリケーションにする可能性についても否定しない。ただその場合は、ユーザーの入力する語がすべてグーグルに送られるというプライバシー上の問題が発生する。これについては、ユーザーからプライバシーに関する同意を得た上で提供することになると話した。

誤用の存在などの課題も

 現状のGoogle 日本語入力には、問題点も複数指摘されている。代表的なのが、誤用だがWeb上で広く使われている言葉が、変換結果の候補に出るという点。わいせつな言葉のように、候補に出すのが不適切と考えられる語も表示される可能性がある。こうした点は同社でも認識しており、適切な候補を出せるように今後改良していくという。基本的には「ユーザーのフィードバックを基に、変換結果をコントロールできる形にしたい」(工藤氏)としている。

 日本語入力ソフトが誤った日本語を候補に出すことについては「問題がある。変換の品質は、社内指標でもトップに据えている」(及川氏)と話す。一方で「正しいとは何か、何を持って誤用とするのか、私たちも答えを出せずにいる」(及川氏)。現状はまだベータ版であるため、今後さまざまな改良を加えていく計画だ。「できるだけ早い段階で“ベータ”を取り、安心して利用していただきたい」(及川氏)。現状では未対応の64ビット版についても、近日中に提供したいという。

 グーグルがこうしたソフトを無料で提供することには、競合製品をつぶしてしまうことになるのではないかとの懸念の声もある。及川氏は、他社についてはコメントしづらいとしながらも「我々は純粋に日本語入力環境を良くしたいと考えているだけ」と説明する。さらに「日本語入力ソフトの市場は、どんどん縮小している。多くのメジャーなプレーヤーが撤退し、今は数社になっている。その結果、技術的なイノベーションが見られなくなってきたのではないか。我々が新たなアプローチを提供することで、市場が活性化するのではないか」との見方を示した。

■変更履歴
記事の途中までしか掲載されていなかったのを修正しました。現在は全文を掲載しています。