財務省による決裁文書の改ざんなど、国の公文書管理のずさんさが連日のように発覚している。電子行政やデジタル時代の民主主義を実現するには、国の公文書は原則オープンデータにする必要がある。

 防衛省が「存在しない」としていた2004年1月から約2年8カ月にわたってイラク復興支援のため南部のサマワで活動していた自衛隊の370日分の活動報告(日報)が4月16日に公開された。朝日新聞デジタルなどが約1万5000ページに上る文書をWebに公開したものの、検索できないPDFファイルだった。

 この日報のPDFファイルについて、OCR(光学的文字認識)でテキストデータ化して誰でも検索できるイラク日報 全文検索【イラク日報村】というWebサイトが登場した。サイトを公開したのはマーケティングリサーチ会社ポップインサイト取締役の森川公康氏だ。「平日の日中は会社なので業務時間外に開発した」(森川氏)と明かす。

図 「イラク日報 全文検索」のWebサイト
図 「イラク日報 全文検索」のWebサイト
[画像のクリックで拡大表示]

 このサイトで文字列を入力して検索すると、文字列が存在するPDFファイルへのリンクと、文字列が登場するPDFファイルのページ番号が表示される。サイトのトップページは「人気のキーワード」のランキングも表示する。

 試しに「戦闘」という文字列で検索すると「全国の攻撃状況」と題した地図に「一部地域において多国籍軍との戦闘」という文言が登場する。緊迫した当時の現地の様子が分かる。

図 イラク日報を検索して閲覧できる内容
図 イラク日報を検索して閲覧できる内容
[画像のクリックで拡大表示]

 なかには「初めて接する他国の挨拶の風習の中で、最近対応に困っているのが『ウインク』である」といった記述も登場する。検索上位の「寿司」といった言葉で検索してヒットする文書も多い。黒塗りで非公開になっている箇所が目立つものの、膨大な文書から自衛隊員がどのように任務にあたっていたかを国民が理解する重要な判断材料になる。日報データを基に複数のWebサイトが登場している。