新型コロナウイルス感染症対策を巡ってはワクチン接種予約の場面や給付金の配布で自治体や国の情報システムに様々な問題が露呈した。例えば自衛隊が実施した大規模接種では市区町村コードと接種券番号を基に予約を受け付けたが同じ接種券番号を使って大規模接種会場と市区町村主催のワクチン会場で二重予約ができてしまった。
市区町村で発行された接種券番号を使っているのだから、ある接種券番号の住民が接種予約済みだとするデータを各市区町村が配信し、大規模接種会場にそのデータを受信できる仕組みを用意すれば二重予約を防げたはずだ。
データ連携の問題を示す典型的な事象であったので、あえて指摘させてもらった。自衛隊と市区町村の接種への取り組みで我が国の接種率は急伸した。関係者の努力には感謝している。
一方、給付金配布を巡っては本連載を担当しているNPO法人IT勉強宴会が『「給付金管理システム」のモデルをアジャイルに考えよう』という会合を開き、データモデルを使ってあるべきシステムの仕様を発表していた。
関連記事 一律10万円をすぐ給付できるシステム、プロの技術者ならどう設計する?コンセプトと製品だけではうまくいかない
複数の情報システムを利用し、続々とデータを発生させ、企業内に蓄積しているのにデータ同士の連携ができておらず十分活用できないことが問題視されている。解決をうたったコンセプトとしてデータファブリック、データマネジメントプラットフォーム、データレイクなどが喧伝(けんでん)され、それらを実現すると称したソフトウエア製品が登場している。古くからあるBI(ビジネスインテリジェンス)ツール、DBMS、データ連携(ETL)ソフトも現役である。だがソフトウエア製品を導入するだけでは決してうまくいかない。
データ連携の問題を解決し、真のデータ活用をするためには、まず現状を把握して必要なデータの所在を確認し、互いにどのデータを連携すればよいのかを検討する。連携と活用の基盤を整備するのはその後である。
なぜデータを使えないのか
ビジネス活動をして情報システムで処理をした以上、結果は必ずデータとして残っている。だが欲しいデータが社内のどこにあるかが分からないし、関連するデータのフォーマットが異なっており組み合わせて使えるデータとして取り出せない。これでは優秀なデータサイエンティストがいても有益な分析はできない。
使えないデータの実態を列挙してみよう。直近3年間の製造や売り上げの推移に関するデータが欲しい場合、関連データが社内のシステム、A社のクラウドサービス、B社のクラウドサービスに分散していたら3カ所からデータを取り出してまとめないといけない。トランザクションデータが設計、製造、物流、販売部門ごとに分断されていて全社の売上実績や購買実績が取引明細レベルで把握できないという現実もある。