全2061文字
PR

 2022年は全ての日本企業がAI(人工知能)の内製開発にかじを切る。この流れに呼応して、個人の同意に基づいて消費者が企業に提供したデータを企業同士が交換する「データエクスチェンジ」が活発になる。様々な企業が消費者のリアルなデータを幅広く集め、AIモデルの内製開発に生かす動きが当たり前となる。

 データエクスチェンジとは、データ売買を仲介する事業者(データプラットフォーマー)が提供するシステム基盤(プラットフォーム)などを介して、消費者のデータを企業がやり取りする枠組みを指す。消費者はプラットフォーマーに対して、EC(電子商取引)サイトの購入履歴やかかった病歴のデータなどを売って金銭などを得る。消費者のデータを集めたい企業はプラットフォーマーと契約し、サブスクリプションなどで利用料を支払う。

 プラットフォーマーは企業にデータを販売する際、誰が提供したかなどを特定できないよう加工する。そもそも消費者はどのレベルまで個人情報を提供するか選べ、場合によっては個人情報を一切含まない情報を提供しても対価を得られる。データを売ることで企業のサービスの質が向上すれば利用者にとってもメリットになる。

 一方で企業のメリットは自社で集めるのが難しい大量の消費者データを金銭で収集できる点にある。AI開発を手掛けるAI insideの渡久地択社長は「AI開発の内製化が進み、あらゆる事業者が消費者のデータの買い手となる可能性がある」とみる。

図 データエクスチェンジの概要
図 データエクスチェンジの概要
企業が消費者データを買う動きが活発に
[画像のクリックで拡大表示]

AIの民主化が加速

 データエクスチェンジが活発になる背景には、「データセントリックAI」と呼ぶ、AIモデル開発の新しい動きがある。データセントリックAIとは、少量であっても高品質なデータを効率よくつくり、高品質なAIモデルの開発につなげるという考え方だ。

 一般にAIモデルを開発しようとすると、数千個という単位でデータが必要なケースも多く、内製開発には膨大なコストがかかる。大量の学習データを集め、整形したりタグ付け(アノテーション)したりする手間がかかるからだ。「AIモデルの開発に取り組んでいる技術者なら誰しも、学習データをつくるコストを減らしたいというニーズがある」(渡久地社長)。

 データセントリックAIにのっとり、高品質なデータだけを効率よく学習させるには、大量かつ多様なデータの中から真に必要なデータを選べる環境が必要だ。それを実現する方法がデータエクスチェンジというわけだ。

 2021年はAIモデル開発のハードルが下がり、AIの内製開発にかじを切る企業も増えた。AIの「民主化」が進み、学習データを効率よくつくりたいというニーズは一層高まっている。