米IBMが米国時間1月29日に,口述記録ソフトウエア「WebSphere Voice Server for Transcription」を発表した。同社の音声認識技術「ViaVoice」をベースにしており,特定の業界向けにカスタマイズすることが可能。

 医師や弁護士といった専門家は,診療記録や法的記録を電話機などの装置に向かって口述し,後日テキスト形式で利用することができる。「手で書き込んだり入力する手間が省け,時間とコストの節約につながる。一度登録したユーザーは,ネットワーク上のどこからでも口述を行える」(IBM社)という

 WebSphere Voice Server for Transcriptionは,各業界向けのソリューションに組み込まれる。「16万語以上のボキャブラリを持ち,小規模の法律事務所から大規模企業まで,さまざまな顧客に対応するよう設計している」(IBM社)

 付属ツール「Topic Factory」により,開発者は専門用語を簡単に追加することができる。またネットワーク管理者は,音声プロファイルを調整することが可能。口述には電話機やUSB対応マイク,モバイル・デジタル・レコーダなどを用いる。口述内容はサーバーで処理する。

 WebSphere Voice Server for Transcriptionには,ランタイム・サーバー,ツールキット,API,プログラムとシステム管理のマニュアル,ユーティリティ,サンプル・クライアント・コードなどが含まれる。

 WebSphere Voice Server for Transcriptionを採用した医療向けソリューション・プロバイダの米MD Productivityは,「MD One」を同日発表した。医師が電話機などの装置を介して記録や報告を口述すると,口述内容がサーバーに伝送され,電子形式に変換される。筆写の専門家が編集した後,医師に電子メールで配信される。

 そのほか,ドイツのDictaNetが法律業界向けのドイツ語版と英語版ソリューションを開発したという。

 「WebSphere Voice Server for Transcriptionにより,専門家は‘話す’という最も自然な通信手段を使って生産性を上げることができる」(IBM社Voice Systems部門ジェネラル・マネージャのWilliam S "Ozzie" Osborne氏)

◎関連記事
米IBMがモバイルe-businessに向けた音声サーバー・ソフトを発表
米IBMが音声アプリ開発のツールキットのベータ版を発表,VoiceXML対応
「音声認識ソフト市場は2005年に27億ドル規模」と米In-Statの調査結果
W3Cが音声記述言語「VoiceXML 2.0」のワーキング・ドラフト公開
米IBMが音声アプリ開発のツールキットのベータ版を発表,VoiceXML対応
米スピーチワークスと三菱電機の米国研究所,音声技術でライセンス契約締結

[発表資料へ]