PR

 AWSの新しいAIサービス「Amazon Lex」「Amazon Polly」「Amazon Rekognition」はいずれも2016年11月に、AWSの年次イベント「re:Invent 2016」で発表され、脚光を浴びた。簡単にいうと、Lexは音声のテキスト変換と自然言語処理(意図解釈)、Pollyはテキストデータの読み上げ、Rekognitionは画像分析を行う(図1)。

図1 AWSのAIサービス
図1 AWSのAIサービス
[画像のクリックで拡大表示]

 後発のAIサービスだが、AWSのユーザーにとどまらず注目を集めている。米Amazon.comがeコマース事業で培ってきた実用性の高い技術をベースとしているからだ。

 AWSのAIサービスといえば、「Amazon Machine Learning(ML)」(本誌2016年12月号サービス評価を参照)を思い浮かべる人がいるかもしない。Amazon MLは数値やテキストのデータを基に予測や判別などを行うのに対して、三つの新サービスは、自然言語、音声、画像などのデータを、主にディープラーニング(深層学習)の技術を用いて認識・分析する。いわゆるコグニティブサービスだ。

 さらにAmazon MLでは、ユーザーが機械学習の基になるデータを用意し、予測や判別を行う機械学習モデルを作る必要があるが、三つの新サービスでは学習済みの機械学習モデルを提供する。用途やチューニングの自由度を限定することで、導入のハードルを下げた。

 本記事では、三つの新サービス、Amazon Lex、Polly、Rekognitionを取り上げる。自然言語を扱うLexとPolly、画像を扱うRekognitionの順に解説したうえで、Rekognitionについて検証を行う。Lexは現時点で日本語を扱えないので、検証は見送る。Pollyについては、解説のパートで、読み上げた音声の印象を示す。

 なおAWSは、Lex、Polly、Rekognitionという新サービスと従来のAmazon MLを総称して「Amazon AI」と呼んでいる。