PR

複数データを組み合わせて精度を高める

 複数のデータホルダーと連携してデータを統合的に分析する場合、大きく2つのハードルが考えられる。

 まず1つ目は、個人情報やプライバシーの保護である。データホルダーが所有するデータは、そのままでは特定可能な個人情報であることが多い。このようなデータを扱うためには(1)改めて個人情報を提供する本人の同意を得る、(2)医療や健康予防といった公益性の高いデータ利用に限った法規制を緩和する等の法整備を待つ、(3)個人を特定できないように十分な加工を行う、などの対応が求められる。当社では2017年9月頃に全面施行が予定されている改正個人情報保護法を踏まえ、「(3)個人を特定できないように十分な加工を行う」ことを実現するための匿名化技術の開発、実験を進めており、すでに一部のデータホルダーとの連携で疑似パーソナルデータ活用の実用化実験を進めている。

 2つ目はデータの連結である。個別のデータソースだけでは分析できない事柄を分析可能とするためには、複数のデータソースを紐づけて疑似的なシングルソースデータを生成する「データ融合」の技術が有用となる。当社は10年前から同技術の研究、実用化を始めており、技術の蓄積も進んでいる。

 こうした技術の活用を通じて、複数のデータホルダーが安全にデータを持ち寄り、巨大な疑似シングルソースデータを生成できるようになれば、統合的な分析が可能になるはずだ。例えば、図2で積極的に健康食品を購入しているグループは、健康についてそのほかどのような対処行動を取っているか、よく接触している情報源は何かが分かるようになる。PHRを慎重に利用することで、そのグループの健康状態の特徴も描写可能となるはずだ。

 前述の通り、今後は他のデータホルダーが保有するヘルスケア関連データと、当社が保有するコミュニケーションデータおよび今回得られたモデルを組み合わせることで、より精度の高いヘルスケア行動モデルの開発を目指していく。本モデルで設定する目的変数には、新患受診数以外にも様々なヘルスケア行動を変数として設定可能と考えており、図3のような展開を展望している。

図3●今後の開発に向けた展望
図3●今後の開発に向けた展望
[画像のクリックで拡大表示]

 なお、数理モデルの詳細については、膨大かつ専門的な内容になるため本稿では割愛した。興味を持たれた方は、博報堂広報室までお問い合わせいただきたい。公開できる範囲で紹介する。