全3519文字
PR

 日本企業の海外進出などにより、海外との連携が増加する中で、言語間の翻訳の必要性・重要性が高まっている。言語間の翻訳に必要となる新たな言語知識の習得には時間と費用を要するので、計算機を用いた精度の高い機械翻訳が期待されている。本調査では、機械翻訳に関する国内外の技術動向、日本及び外国の技術競争力の状況と今後の展望を明らかにすることを目的として、本技術に関する特許や研究開発論文などの解析を行い、今後、取り組むべき課題や方向性について提言を行った。

 「もう英語学習は要らなくなるかもしれない」、そうした記事を見かけるようになりました。その背景としては、機械翻訳の性能が格段に向上したことが挙げられます。

 機械翻訳技術を大きく分類すると、ルールベース方式とコーパスベース方式に分けられます。ルールベース方式は、翻訳知識を規則(ルール)として人手で作成し、それらを組み合わせて訳文を生成する方式で、機械翻訳技術初期の1950年代から研究されています。コーパスベース方式は、大量の対訳文(コーパス)から翻訳知識を自動獲得して利用する方式で、1990年代以降、現在に至るまで盛んに研究が進められています。

 一方、機械学習や人工知能と呼ばれる技術(AI関連技術)の研究開発が、計算機や画像処理専用プロセッサの高性能化を背景として、2010年以降に第3次ブームとなっています。その中で、ニューラルネットワークを用いたコーパスベース方式、いわゆるニューラル機械翻訳が2014年に登場し、その後、機械翻訳技術のそれまでの成果を大きく上回る結果を出すに至っています。そして、AI関連技術の更なる進歩に伴い、機械翻訳技術の研究開発も、今後、更に進展していくと考えられます。

 このような背景の下、特許庁は「令和2年度特許出願技術動向調査」において、機械翻訳に関する市場動向、政策動向、特許出願動向、研究開発動向等の調査を行い、今後、取り組むべき課題や方向性について提言を行いました。本調査の主要部分を本稿で紹介します。

 本調査では、「機械翻訳」(図1)を、「自然言語の原文を直接与えるか、音声、画像・映像等を通じて取得させ、音声、画像・映像等の特徴認識から得られる情報も加味するなどして、その自然言語の原文に含まれる全要素が、他の自然言語への訳文に適切に訳出されるように、翻訳・通訳する変換処理を、コンピューターを利用して、自動的に行なったり支援したりする技術」と定義した上で、機械翻訳に関する技術を、その「翻訳対象」、「要素技術」(「データ取得」「テキスト前処理」「翻訳方式」「言語解析」「モデル構築・翻訳処理」「後処理・運用」)、「技術課題」の観点から分析しました。

図1 機械翻訳の技術俯瞰図
図1 機械翻訳の技術俯瞰図
[画像のクリックで拡大表示]