PR
写真●MobileSUITE Voice Operationを使って開発したアプリケーションのサンプル画面
写真●MobileSUITE Voice Operationを使って開発したアプリケーションのサンプル画面
[画像のクリックで拡大表示]

 富士通は2014年9月24日、アプリケーションに音声認識機能を組み込むためのライブラリー製品「MobileSUITE Voice Operation」(写真)を発表した。10月1日から出荷する。これを使うと、スマートデバイス(Android/iOS)やWindowsのアプリケーションに音声認識機能を容易に組み込めるようになる。音声を認識するエンジン機能はライブラリー側には搭載しておらず、クラウド型で提供する。

 MobileSUITE Voice Operationは、アプリケーションに音声認識機能を組み込むためのライブラリーである。同ライブラリーを組み込んだアプリケーションは、音声データを富士通のデータセンターに転送する。データセンター側に設置した音声認識エンジンが、これを解析する。音声認識エンジンとして、フュートレックの「vGate」を利用している。

 価格は案件ごとに個別見積もりで、課金は従量制ではなく固定額となる。要件定義の際に、音声認識の件数(APIコール数)や音声データの総時間など、想定しているシステム負荷を割り出し、ここから固定料金の額面を見積もる。ユーザー企業との話し合いの中で、エンドユーザー1人当たり月額数百円など、あまり高額にならない値ごろ感で提供したいとしている。

 ライブラリーを利用できる開発言語は、C#(Windows)、Java(Android)、Objective-C(iOS)。利用に当たって、ユーザーに特有の専門用語をあらかじめ辞書に登録しておくことができる。