
電子カルテなど医療情報システムの導入で、診療現場での課題としてよく耳にするのが、入力インタフェースの作業効率の問題だ。最近では「キーボードアレルギー」という医師が少なくなったとはいえ、患者の目を見ながらブラインドタッチでキーボード入力を行えるほどのスキルを持つ医師はごくわずかだろう。多くの臨床医にとって、データの入力操作が、本来の診療業務への集中を妨げ、業務効率に悪影響を与えているのでは、と疑問を感じている医師も少なくないはずだ。
1990年代から、パソコンベースのさまざまな入力支援機能やツールが開発される中で、大手ITベンダー数社が音声認識ツールによる音声入力の、医療現場での実用化を試みてきたが、大半の技術は音声認識率に課題を残したまま頓挫していった。が、高度な音声認識技術の開発に特化してきたアドバンスト・メディアは、ここへきて電子カルテシステムのほか、放射線科や調剤薬局向けなど医療分野向けの音声入力システム「AmiVoice」シリーズを相次いで製品化し、医療分野でのシェアを広げつつある。そこで今回、実際に読影レポートの作成で「AmiVoice」を使用している順天堂大学医学部附属練馬病院(写真)放射線科の取材を通じて、臨床現場での入力デバイスとしての実力を検証してみた。
近年、大規模・中核病院の放射線科では、モダリティの性能向上に伴って1日の撮影件数は増える一方で、読影医のレポート作成にかかる負担は日ごとに増しつつある。しかも、医療画像のフィルムレス化が進み、画像ディスプレイによる診断と、読影レポート作成ツールの普及によって読影環境は大きく変わってきている。
「正確であること」は当然のことながら、あわせて「いかにして効率的な方法で読影レポートを作成するか」が、放射線科医にとってますます重要さを増している。正確で効率的なレポート作成のために口述録音とトランスクライバー(音声データや録音テープなどで残された音声を聞き取りながら文書化する人)による入力を行う放射線科もあるが、優秀なトランスクライバーを養成すること、また養成した人員を確保すること、そして、その人件費は大きな課題としてのしかかる。それゆえ、読影医による連続音声認識エンジンを用いた正確で効率の良いレポート作成は、様々な面で大きな魅力であることは確かなようだ。
月間3000件以上のレポート作成に不可欠

「以前に勤務していた病院では有能なトランスクライバーがいて、私自身がキーボードでレポートを作成することはほとんどなく、音声認識ソフトについては性能に懐疑的だったことに加え、自ら進んで使ってみようという考えもありませんでした。ところが、当院に赴任してから実際に利用して使い慣れると、性能的にはトランスクライバーと比較しても、ほぼ遜色ないと感じるようになりました」。順天堂大学医学部附属練馬病院放射線科 先任准教授の尾崎裕氏は、約8カ月間の利用経験をもとに音声認識ソフトの印象をこう述べる。
同院放射線科では、常勤医師3名、非常勤医師2名の体制で読影を行い、月間3000件以上のレポートをダブルチェック体制(1レポートごとに2人の医師が読影)で作成しており、尾崎氏も毎日100件以上の読影をこなしている。同病院では、富士通の電子カルテシステム「HOPE/EGMAIN-FX」の読影レポート作成ツールと放射線画像診断レポート音声認識システム「AmiVoice Ex Rad」をすべての医師が利用している。「私はブラインドタッチができないので、キーボード入力の場合の5分の1~10分の1ほどの作成時間ですみます。ブラインドタッチができる人でも、半分くらいの時間で作成できるでしょう。レポート作成の効率性からいえば、音声認識ソフトがなければ月間3000件強のレポート作成は不可能です」と尾崎氏は指摘する。
日本語・英語混在表現もほぼ正確に認識

実際の臨床現場で使えるかどうか、業務効率を格段に向上できるかどうかには、専門用語を含む連続音声の認識率が大きく関与する。高い認識率を保持するためには、専門性の高い医療分野の各種用語を辞書として標準で持っていること、イントネーションやアクセント、口述スピードに影響されない認識ができることが必要条件といえる。加えて、日本の医学用語特有の表現・表記として、医師の会話や、カルテ、読影レポートの記述に、日本語と英語を混合して使うことが一般的になっている。それらをきちんと認識して入力・変換できないと修正作業に追われ、かえって効率は低下してしまう。
「例えば、『両肺にtumor(※注1)やConsolidation(※注2)はない』といった表現(写真2参照)をしますが、日本語の専門用語のみならず、英語を混ぜた表現が医学用語としてきちんと認識・変換されなければソフトとして使い物になりません。しかも、英語の発音がカタカナ的な表音であっても認識してくれないと困ります。Amivoiceの最新バージョンでは、こうした表現も正確に認識します」(尾崎氏)。

AmiVoice Ex Radは、単純X線/CT/MRI/血管造影/核医学の所見レポートの単語を約3万5000語登録した辞書を実装している。また、英語表現では、『tumor』なら「ちゅーもあ」「ちゅーまー」「つもーる」など複数の読み方を登録しており、ネイティブな発音でなく、和声的な読みでの認識精度を高めている。認識率に関しては、「ある病院の放射線科では98%」(アドバンスト・メディア)という検証結果もある。これまでに全国660施設以上の放射線科への導入実績(2009年3月末現在)があるという。
尾崎氏は続ける。「画面(写真3参照)のように発声の最初に韻音を『も』と感知してしまうことはあるが、誤認識による修正はほとんど必要なく、「てにをは」といった通常のレポートの体裁を整える修正だけで完成できます。強いていえば、読影数をこなしてきた夕方など、疲労により声の抑揚が変化したり、滑舌が悪くなると誤認識が増える傾向があるぐらい」と、認識率の高さを評価している。
<文中注釈>
注1)tumor=腫瘍
注2)Consolidation=浸潤影