デジタル文書形式として一般的な「PDF」だが、閲覧・印刷用だけに困るのはデータの再利用。「PDFじゃなくて元のWord文書をくれ!」と頼めるのは職場の同僚くらいで、Webサイトや取引先から入手したPDFはいつも困る。こんな再利用ニーズが増えるに従って、PDFをWordやExcelなどのデータ形式に変換するソフトの売れ行きが伸びている。
下図はその一つ「読取革命Ver.10」を使ってPDFをWord文書に変換した例だ。文字サイズやレイアウトに微妙な違いこそあれ、きちんとWord文書になっており、文章などを自由に編集できる。
![]() |
![]() |
![]() |
![]() |
図1 元のPDF(Adobe Reader) |
![]() |
![]() |
![]() |
![]() |
![]() |
図2 変換後のWord文書 |
![]() |
このようなPDFの“逆”変換ができるソフトは1980円から2万円以上の製品までさまざま。主な製品を下表にまとめた。
どの製品を選ぶかは目的で判断したい。大ざっぱに文章だけを変換したいなら、どの製品もそれほど差はない。だが、複雑なレイアウトをなるべく正確に変換したい、文字を一字一句正確に変換したいなど、要求レベルが上がると違いが出てくる。
覆水を盆に返すごとし
だが製品選びの前に「PDF逆変換の常識」として「100%完全な復元は不可能」という点をキモに銘じたい。WordやExcelのデータを元に作ったPDFを逆変換ソフトにかけても、元のデータは完全に再現できない。改行位置やフォントなど微妙なズレがたくさん生じるのだ。例えばWordの段落書式には、行揃え方法やインデントなどたくさんの設定項目がある。だが、それを元に作ったPDFでは印刷に関するもの以外、大半の情報が失われてしまう。そもそもPDFの中身は単なる描画命令であり、「図や罫線は線などのシンプルな図形を組み合わせているだけ」(アンテナハウス)。それを「ここは表に見えるから表として変換しよう」などと推測し、可能な範囲で復元するのが逆変換ソフト。まさに「覆水を盆に返す」ような仕事なのだ。