全2204文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 米グーグルが、ディープラーニング(深層学習)を活用することで「コミュニケーションの壁」を取り払うための技術開発に注力している。同社はその取り組みについて2019年10月末、報道機関向けに米国マウンテンビューで説明会を開催した。

 話題は大きく2つある。1つは高精度な音声認識による文字起こしアプリ。もう1つは、発話したり体を動かしたりするのが困難な人の意思伝達を音声認識技術によって支援する取り組みである。

図1 70超の言語に対応する文字起こしアプリ
図1 70超の言語に対応する文字起こしアプリ
クラウド型の音声認識による文字起こしアプリ「Live Transcribe」は、70超の言語に対応する。グーグルの担当技術者であるSagar Savla氏によれば、現状では、1対1や家族などの少人数グループでの会話向けに作られているという。写真の人物が同氏。
[画像のクリックで拡大表示]