アドイン研究所は5月17日,音声認識で動くアプリケーションを作るための開発ツール「IntelliVoice」を出荷開始した。開発キットが250万円,ランタイム版が20万円で,1年間にそれぞれ100本,300本の販売を目指している。Windows 95/98/NTで稼動し,特別なハードウエアは必要ない。

 IntelliVoiceは,音声認識エンジンや独自スクリプト言語エンジンなどで構成される。音声認識エンジンは,ベルギーのLernout & Hauspieが開発したもので,「世界で最も有力な音声認識エンジンの一つ」(同社)。独自スクリプトでは,認識した結果からどのような操作を行えばいいのかを記述する。コードは例えば以下のようになる(付属サンプル・プログラムの一部を抜粋)。

;◆ 出前頼む
PATTERN 3100: [%S{OMISE},*,出前,*,頼む,*] {
  IF ?%作業 THEN
    SAY [すみませんが今は,%作業,中なんです、,
       また後程呼んで下さい]
    %予約 = 出前の注文受付
  ELSE
    SAY [何を注文しますか?]
    %作業 = 出前の注文受付
    RESET %目的地
    %開始時刻 = %_SEC
    %店名 = %S
    ;;ダミー記憶
    REMEMBER %S
    TRY 3200,800,900
  ENDIF
}

ここでは認識した結果の中に「出前」「頼む」などの単語が含まれていた場合は,以下の部分を実行するようにしている。このサンプルを実行すると図=約40KBのような画面が表示され,人間がパソコンにしゃべりかけ,パソコンが音声を合成して人間に答えるという動作が可能になる。例えば「ラーメン屋に出前頼む」というと「何を注文しますか?」と聞いてくる。

 このほかの特徴としては,(1)不特定話者に対応している,(2)使用する単語の音声を学習させる必要がない,(3)単語単位で区切って話す必要がない,(4)米語,英語,ドイツ語,イタリア語,フランス語,オランダ語,スペイン語,中国語を認識できる,などがある。DLLを呼び出すなどの方法で音声認識,音声合成機能を呼び出すこともできる。

 アドイン研究所は99年夏ごろに,娯楽施設のロボット向けに音声認識ソフトを開発して納入した。その際につちかった技術を活用するためにIntelliVoiceを製品化したという。