全3077文字
PR

 新型コロナウイルスの感染拡大防止に役立つはずの行政機関による「オープンデータ」が期待に応えていない。厚生労働省は感染者数などの基本的な情報でさえ画像データで提供している。正確な情報を誰もが迅速に共有できる「オープンデータ」活用を通じて行政の業務効率の改善を急ぐ必要がある。

 厚労省は2020年2月から「国内の発生状況について」と題して新型コロナウイルスに関する検査件数や患者数などをまとめた一覧表を掲載している。ところが一覧表は4月16日時点でPNG形式の画像データで公開している。厚労省は新型コロナ関連の他の調査結果もPDFやHTMLで公表している。

厚労省がWebサイトで公表している表形式の画像
厚労省がWebサイトで公表している表形式の画像
(出所:厚生労働省)
[画像のクリックで拡大表示]

 これでは表中の数値をコンピューターで二次利用するには、画像やPDFに対してOCR(光学的文字認識)を使ったりWeb画面をスクレイピングしたりして数値を抽出するしかない。だが誤抽出も起こり得る。そうなれば修正する手間がかかる。最初からCSV形式などのオープンデータとして公開するほうが効率的だ。

オープンデータの意義、浸透せず

 オープンデータとは、パソコンやスマートフォンなどを使えば誰でも無償で二次利用や機械処理が可能なデータを指す。2016年12月施行の官民データ活用推進基本法は、国や地方自治体がオープンデータに取り組むことを義務付けた。

 しかし肝心の政府内ですらオープンデータの意義がまだ浸透していない。政府のIT政策関係者は「表計算ソフトを表をつくるツールだと思っている。計算に使うツールだということが分かってない」と明かす。

 政府が国や自治体にオープンデータを義務付けている理由は、民間企業のみならず公的機関の業務効率を大幅に高められるからだ。福井県鯖江市に拠点を置き、早くからオープンデータに取り組んできたソフト企業jig.jp(ジグジェイピー)の福野泰介会長は次のように指摘する。「新型コロナに関する全都道府県のオープンデータがそろえば、厚労省への報告や厚労省内での取りまとめ作業の負荷が減り、より早い判断が可能となる」。