PR

Big“Small Data”からSmall“Big Data”へ

 ゲノム・オミックス医療やモバイルヘルスがもたらす「医療ビッグデータ革命」。その革新性は果たしてどこにあるのか。例えば、臨床検査結果や医用画像、レセプトなどを集めたデータベース、集団単位での罹患情報(疫学情報)といった「大規模に蓄積された医療情報」との違いは何か。田中氏が指摘したのは「データ解析の目的」や「データの特性」における両者の違いだ。

 従来の「大規模に蓄積された医療情報」は、「Population Medicine」の確立を目指すものだった。すなわち、個別データを多数集めることで「集合的法則」を見い出すことが目的だった。データ特性の点から見ると、1サンプル(被験者)当たりの項目数(属性数)は少なく、サンプル数が多いことに特徴がある。Small data(小さなデータ)の大きな集合、すなわちBig“Small Data”である。

 これに対し、ゲノム・オミックス医療やモバイルヘルスによるビッグデータは「Personalized Medicine」の実現を目指すものだ。大量のデータを集め、「個別化パターンの多様性」を見い出すことが主眼となる。データ特性の点から見ると、サンプル数は多くないが、1サンプル当たりの項目数が膨大となる。Big data(大きなデータ)の小さな集合、すなわちSmall“Big Data”である。

 こうしたデータの活用目的や特性の違いから、医療分野で生まれつつあるビッグデータの処理に対応できるデータ科学を新たに構築する必要がある。田中氏はこう指摘する。