全3367文字
PR

 茨城県つくば市は約24万人の住民のダミーデータを基に全国でも初めてとみられるアイデアソンを開催した。参加者に公開されたのは住民票や国民健康保険のレセプトデータなどを基に、統計データとして同じ性質を持つよう作成した架空のダミーデータである。

 これまで自治体が開催するアイデアソンは、すでに自治体が誰でも利用できるよう開放したオープンデータを使っていた。オープンデータは誰でも出所さえ明記すれば営利目的を含めて無償で二次利用や機械処理が可能なデータだ。

 しかし住民のデータは個人情報の保護を理由にオープンデータの対象外とされてきた。たとえ個人のプライバシーに影響を与えないようにした統計データであっても、外部の企業などがデータを利用するにはハードルが高いという現実があった。

 今回つくば市がアイデアソンの参加者に公開したのは、実際の住民の個人には結びつかないダミーデータだ。ダミーデータとはいえオープンデータの対象外とされてきた住民のデータに似せてある。例えば高齢者が生計を維持している世帯がどの地域に多いのかを地図上に示して地域の課題を可視化するといった、分析のアイデアを生み出したりノウハウを学んだりするのには有用だ。

写真 2020年1月に開催された「Hack My Tsukuba 2019」の様子
写真 2020年1月に開催された「Hack My Tsukuba 2019」の様子
[画像のクリックで拡大表示]

 参加者に住民のデータに近いデータを公開して活用策を考えるアイデアソンは全国でも初めてとみられる。アイデアソンを共催した筑波大学でオープンデータや公共データ分析に詳しい川島宏一教授は「つくば市役所の努力で最も詳しいデータを使えるようになった」と従来にない試みを評価する。住民のデータを利用できれば、地域の事情に応じた必要な施策を打ち出しやすくなるからだ。

 「Hack My Tsukuba 2019」と題して2020年1月に開催されたアイデアソンには、つくば市の職員らに加えて市内外から元医師や元大学教員、コンサルタントら専門知識のある30人が集まった。表計算ソフトのExcelを使って相関や回帰分析を行う手法や分析の想定案を参考に、地域の課題解決のためにどのようなデータを活用すればよいかというアイデアを出し合った。

 参加者に公開されたのは、つくば市が業務で利用する約24万人の全市民の情報を参考に、NECで自治体業務システムを担当する岩田孝一部長が作成したデータだ。氏名などの項目を除く「住民基本台帳データ」の一部や、過去3年分の「国民健康保険」「後期高齢者医療」で医療機関が請求する医療報酬の明細書であるレセプトデータのほか、「介護保険」や「特定健診」「後期高齢者医療健診」の項目データ、さらには異色のデータとして自治体が管理する「飼い犬登録情報」も用意された。

 アイデアソンではまず、参加者が地域ごとにどんな課題があるか検討した。住民基本台帳データからは中学校区の地域ごとの世帯の年齢構成などが把握できるほか、国民健康保険や後期高齢者医療のレセプトデータからどんな病気が多いのかが分かる。介護保険もレセプトデータからどの地域にどの要介護度の区分の住民が多いのか分かる。

 これらのデータを掛け合わせて分析すれば様々な地域ごとの特徴が分かる。例えば特定健診でメタボリックシンドロームと判定された人数と、犬を飼っている世帯数との間に相関関係があるかどうかも見られる。もし何らかの相関があれば、散歩にでかける必要のある犬を飼っている世帯が多い地域はメタボ判定を受ける人数が少ないのではないかといった仮説を立てて検証できる可能性がある。

 参加者のあるグループは、つくば市内の一部地域で急激な人口増加に伴って小学校の1学年当たりのクラスが増えている地域があるとして、オープンデータである年齢別の人口データを使って未就学児童数の年度別の増加数に注目して調査した。その結果、地域での出産数に比べて地域外から転入する未就学児童数が約5倍に達していて、地域ごとに必要な小学校の規模を予測するには転入数の正確な把握が不可欠であることが分かったという。

 転入数を正確に予測するには、例えばマンション建設や宅地造成といった許可件数のデータと連携すれば予測できる可能性がある。様々なデータを掛け合わせて分析すれば、小学生の急増という将来の行政課題に対して先手で小学校の新設といった準備ができるというわけだ。