PR

 米Amazon.comが音声アシスタント「Alexa」の機能強化を進めている。2018年9月に新機能を6種類追加し、Alexaのアプリケーションに相当する「スキル」の開発ツールにも機能強化を加えた(表1)。

表1 Amazon.comがAlexaに追加した機能
名称内容
Acoustic Event Detectionユーザーの留守中にAlexaが「警備モード」になり、窓ガラスが割れる音などを検出する
Whisper ModeユーザーがAlexaにささやきかけると、Alexaが「Whisper Mode」になり、以降は小さい音量で読み上げをする
Multi-Step Request in One Shotユーザーが1個の文章に複数のリクエストを入れてきた場合に、各リクエストを別個のものとして認識する
Probabilistic Context Carryoverユーザーとの会話の文脈(コンテキスト)を理解し、2回目以降のリクエストで省かれた目的語などを補う
Natural Skill Interactionユーザーが好んで利用するスキルを学習し、スキルが省かれたリクエストを受け取った場合に、スキルが何か推測する
Automatic Equivalence Class Learning未知の単語に遭遇した場合に、ユーザーとの会話からその単語の同義語を推測する

 「消費者と音声でやり取りする会話AIを、機械学習のエキスパートでなくても開発できるようにするのが我々の狙いだ」。Amazon.com Alexa担当バイス・プレジデント兼サイエンティストであるRohit Prasad氏はそう語る。Prasad氏にAlexaの機能強化のポイントなどについて聞いた(図1)。

図1 Rohit Prasad氏
図1 Rohit Prasad氏
Amazon.comでAlexaの音声認識、自然言語理解、機械学習技術の研究開発を統括する。

Alexaの現状は?

 Alexaはスキルの数が5万種類を超えた。日本語にのみ対応するスキルも1000種類以上存在する。Alexaをオープンなプラットフォームとして公開し、スキルを開発する「Alexa Skills Kit」と、Alexaを搭載するデバイスを開発する「Alexa Voice Service」を用意して、誰でもスキルを開発できるようにしたことが奏功した。

 Alexaは2014年にリリースした当初から、音声認識や自然言語理解にディープラーニングを採用している。ディープラーニングでは認識精度を改善するために、大量のラベル付き教師データを用意する必要がある。そこで我々は2つの新しい手法を採用することで、この問題を改善した。

 1つは能動学習(Active Learning)だ。大量のデータに対してランダムにラベル付けをするのではなく、少数のデータをより賢くサンプリングしてラベル付けし、少ない教師データで効率的にモデルを訓練する。