PR
ムーター(Mooter)の稲村尚志社長(左)と、形態素解析技術「MARIMO」の開発者である田中優・執行役
ムーター(Mooter)の稲村尚志社長(左)と、形態素解析技術「MARIMO」の開発者である田中優・執行役[画像のクリックで拡大表示]

 検索エンジン・言語解析技術を提供するムーター(東京・港区)はこのほど、言語解析の新技術「MARIMO(マリモ)」を開発した。今後、自社で展開する検索サービス(Mooter)や、企業向け口コミ情報解析サービス(Mooterパトロール)、他社の検索ツールなどへの導入を進める。

 ウェブ上の文章情報を検索したり分析したりするには、文章を意味のある最小単位の単語に分割し、名詞、形容詞などの品詞を特定する「形態素解析」という機能が必要になる。例えば、「今日は晴れています。」という文章であれば、「今日=名詞」「は=助詞」「晴れ=動詞」「て=助詞」…と解析する必要がある。MARIMOはJavaのプログラムでこの機能を提供する。

 英語などのようにもともと文章が単語に分割されている言語の場合、形態素解析は容易だが、日本語などの言語では解析の精度に課題があった。Googleなど英語圏発祥の検索エンジンの日本語版では、「今日=名詞」のような辞書をあらかじめ用意しておき、これと照合する方式が主流。インターネット上のブログや電子掲示板では、「ググる(Googleを使って検索するという意味)」「モー娘。」のような新語や略語・俗語が絶えず登場するため、辞書を手作業で更新し続けなければ解析精度を維持できない。

 MARIMOでは文章を自動的に収集し、よく使用されるパターンを抽出。例えば、単語の前後関係を解析し「ググらない」「ググる」などと「活用」していれば、「この単語は動詞ではないか」というように、単語の切れ目や品詞を自動学習する。

 「MARIMOの解析精度は、新聞記事などのような文語体の文章では既存技術とさほど変わらないが、ブログや携帯電話からの書き込みのような口語主体の文章では、自動学習によって高い精度を確保できる」(開発を担当する田中優・執行役)。企業が自社製品に関するウェブ上の評判を解析するなどの用途で、効果を発揮すると見ている。今後は、形態素解析後の「係り受け(主語と述語の関係など)」の把握にも、同様の自動学習の考え方を応用できるように開発を進める。

 稲村尚志社長は、「Mooterは独特の技術で、日本語のような構造の言語に強い検索エンジンとして評価を得ている。日本発の言語解析ツールとして、(同様の言語構造を持つ)中国語、韓国語、アラビア語などでも使えるようにしたい」と意気込みを語る。