JR東日本は2022年1月20日、IC乗車券「Suica」の乗車履歴を活用した統計データを社外に販売する検討を始めたと発表した。首都圏にある約600駅の利用データが対象で、自治体や民間企業の利用を見込む。実現すれば、日本の鉄道事業者がIC乗車券の履歴を活用したデータを販売する初めてのケースになるという。
Suicaデータの活用を巡っては、2013年6月にJR東日本が日立製作所へデータを外部提供する旨を一旦は公表したが、批判が相次ぐ「炎上」状態となり中止した経緯がある。JR東は外部有識者も交えて経緯を検証するなど、利用者や社会から理解が得られるデータ活用のあり方を探ってきた。
人流や動線データの事業化は、携帯電話事業者やIT企業が端末の位置情報やスマートフォンアプリを活用して手掛けている。競合もあるなか、実質的に8年半の検討を経てJR東日本が展開を目指すデータ外販のスキームは、過去を教訓に「安全策」に振った慎重なものとなっている。
外部提供は統計データのみ、8年前からは「後退」
JR東日本が社外へのデータ販売を検討するのは「駅カルテ」。データ集計の仕組みを定型化し、まず駅ビルのマーケティングなど社内利用から始める。社外販売は「検討が進めば2022年内には販売を開始したい」(担当するMaaS・Suica推進本部 データマーケティング部門)考えだ。料金体系などは未定。
JR東日本が駅カルテで採った第1の「安全策」はデータの形式だ。社内利用と社外提供ともに、Suicaの利用履歴データそのものではなく、集計処理を終えた統計データに限って活用する。さらに統計データを加工しても特定個人の動線を類推・抽出できる恐れがないよう、集計の粒度を一定程度まで大きくした。
駅カルテでは4種類の統計データを提供する。このうち中心となるのは駅ごとの利用状況リポートである。月次のSuicaの全利用履歴データを基に、駅ごとの乗降客数の推移を1時間ごとの時間帯別、10歳ごとの年代別・性別に集計し、平日と休日に分けてグラフ化する。
統計化する集計の単位は1時間や10歳ごとと粒度を大きく取り、集計後の利用者数も50人単位で丸める。さらに集計した利用者数が30人未満となった時間帯と年代別の集団はリポートに掲載しない。集計した集団が少ない場合に、他データと掛け合わせるなどの加工で個人の動線が特定できる可能性を排除する狙いだ。JR東日本は「プライバシーへの配慮を徹底した」と説明する。
一般に、個人にひも付くデータを外販する仕組みとしては、特定の個人を識別できないように個人データ(個人情報のデータベース)を加工した「匿名加工情報」もある。データから個人情報を復元できないように加工されていることが前提だが、匿名加工情報であれば統計データと同様に本人の同意がなくてもデータの第三者提供ができる。
しかし、JR東日本は駅カルテで統計データの提供にとどめ、匿名加工情報の提供を見送った。利用を希望する自治体や企業の声を踏まえると、駅カルテで十分に需要に応えられると判断したという。2016年に神奈川県逗子市、2020年には神奈川県藤沢市に集計後の統計データを提供した実績があり、実際に自治体の需要に応えられたとする。ただしデータ活用という観点からは8年半前より「後退」し、保守的なサービスにとどめたともいえる。