PR
図1 ユーザーインタフェースを改良した「リッチテキストPDF4」。PDFのプレビューや文書情報を見られるようにした
図1 ユーザーインタフェースを改良した「リッチテキストPDF4」。PDFのプレビューや文書情報を見られるようにした
[画像のクリックで拡大表示]
図2 段組みを認識させるために、その範囲を指定できるようにした
図2 段組みを認識させるために、その範囲を指定できるようにした
[画像のクリックで拡大表示]

 アンテナハウスは2007年12月6日、「リッチテキストPDF4」(図1)を12月17日より発売すると発表した。リッチテキストPDF4はPDF文書をWord、/Excel/一太郎の文書に変換できるソフト。従来製品の後継版を「リッチテキストPDF4 スタンダード」(価格は1万290円、ダウンロード版は7350円)とし、そのほかに上位版の「同 コンプリート」(価格は1万5540円、ダウンロード版は1万1025円)、簡易版の「同 ライト」(ダウンロード版のみの提供で価格は5250円)を新たに用意した。

 コンプリートとスタンダードの最大の違いはOCR。コンプリートにはOCR機能を搭載した。従来、リッチテキストPDFでは、PDF内に文字コードやレイアウト情報などが含まれているもののみ、その情報を解析してWordやExcelの文書に変換していた。そのため、紙文書をスキャンして作成した画像のPDFなどは変換できず、PDFを一枚の画像としてWordに貼り付ける処理のみを行っていた。今回、OCR機能を搭載することで、画像のPDFから文字情報を抽出し、WordやExcelに再現できるようになった。OCRは日本語と英語に対応する。OCRエンジンは「全く畑の違うものなので、開発しようと思うと何年もかかってしまうため」(アンテナハウスの畑中堅一氏)海外製のものを採用した。

この記事は会員登録で続きをご覧いただけます

日経クロステック登録会員になると…

新着が分かるメールマガジンが届く
キーワード登録、連載フォローが便利

さらに、有料会員に申し込むとすべての記事が読み放題に!
日経電子版セット今なら2カ月無料