全2979文字
PR

新型コロナ対策に役立つはずのオープンデータが期待に応えていない。厚生労働省は感染者数などの基本情報でさえ画像データで提供している。オープンデータ活用を通じて行政の業務効率の改善を急ぐ必要がある。

 厚労省は2020年2月から「国内の発生状況について」と題して新型コロナウイルスに関する検査件数や患者数などをまとめた一覧表を掲載している。ところが一覧表は4月16日時点でPNG形式の画像データで公開している。厚労省は新型コロナ関連の他の調査結果もPDFやHTMLで公表している。

 これでは表中の数値をコンピューターで二次利用するには、画像やPDFに対してOCR(光学的文字認識)を使ったりWeb画面をスクレイピングしたりして数値を抽出するしかない。だが誤抽出も起こり得る。そうなれば修正する手間がかかる。最初からCSV形式などのオープンデータとして公開するほうが効率的だ。

オープンデータの意義、浸透せず

 オープンデータとは、パソコンやスマートフォンなどを使えば誰でも無償で二次利用や機械処理が可能なデータを指す。2016年12月施行の官民データ活用推進基本法は、国や地方自治体がオープンデータに取り組むことを義務付けた。

 しかし肝心の政府内ですらオープンデータの意義がまだ浸透していない。政府のIT政策関係者は「表計算ソフトを表をつくるツールだと思っている。計算に使うツールだということが分かってない」と明かす。

 政府が国や自治体にオープンデータを義務付けている理由は、民間企業のみならず公的機関の業務効率を大幅に高められるからだ。福井県鯖江市に拠点を置き、早くからオープンデータに取り組んできたソフト企業jig.jp(ジグジェイピー)の福野泰介会長は次のように指摘する。「新型コロナに関する全都道府県のオープンデータがそろえば、厚労省への報告や厚労省内での取りまとめ作業の負荷が減り、より早い判断が可能となる」。

 誰もが知りたいと考えるデータを行政機関が公開していなければ、行政機関は電話やメールなどの問い合わせ対応に追われてしまう。オープンデータを提供すれば、利用者は自由に加工でき、自分たちのシステムやアプリにデータを自動反映できるようになる。

 「重要な情報をさっと知りたい人、詳しく知りたい人、じっくり自分で分析したい人、どんなニーズにも応えられる」(福野会長)。官民挙げて取り組む必要がある新型コロナの感染拡大防止にはオープンデータが不可欠だ。

民が先導し対策に活用

 新型コロナの感染拡大防止に向け、いち早くオープンデータに取り組んだのは東京都だ。ヤフー元社長である宮坂学副知事の下、一般社団法人コード・フォー・ジャパンが開発した「新型コロナウイルス感染症対策サイト」を2020年3月に公開した。

 成果はWebサイトの構築だけではない。同サイトのソースコードをソースコード共有プラットフォーム「GitHub」にオープンソースとして公開したり、他の自治体と協力してそれぞれの自治体がオープンデータを公開できるように助けたりした。

 さらに東京都のサイトのデータ設計に携わったコード・フォー・ジャパンの有志が「新型コロナウイルス感染症対策に関するオープンデータ項目定義書」を作成した。同定義書は陽性患者数や検査実施件数などについて標準的なフォーマットを定めている。

 各自治体は同定義書に沿ってオープンデータを作成すれば、情報発信の効率を高められる。共通様式で機械処理しやすいオープンデータであれば、誰もがデータの正確さを検証して即時に共有できるようにもなる。