全3229文字
PR

 米Google(グーグル)のサードパーティークッキー代替技術「FLoC(Federated Learning of Cohorts、フロック)」に関する議論が百出している。プライバシー保護と高い広告配信精度を両立できるとする同社の主張に対して、反対意見を表明する業界団体や競合他社が続出した。FLoCを中心に、サードパーティークッキー代替技術の本命争いが激しさを増しつつある。

 「利用者の関心に基づく広告の新しいアプローチだ。プライバシーを向上させ、媒体企業の広告ビジネスモデルに必要なツールを提供する」。グーグルのマーシャル・ベイル氏はFLoCをこう説明する。同氏はサードパーティークッキー代替技術の開発プロジェクト「プライバシーサンドボックス」でプロダクトマネジャーを務める。

米グーグルの「FLoC」を巡る動き
米グーグルの「FLoC」を巡る動き
[画像のクリックで拡大表示]

 同社は2021年3月30日(米国時間)、Webブラウザー「Chrome」のバージョン「89」でFLoCの開発者向け試験を始めた。日本のほか米国、オーストラリア、ブラジル、カナダ、インドなど計10カ国を対象に、順次増やすとしている。

「広告精度は95%」、プライバシーと効果を両立とグーグル

 FLoCは機械学習の一種である連合学習(Federated Learning)を使ったデータ分類技術だ。パソコンやスマートフォンなどの端末側でモデルを学習させ、その結果をサーバーに集約し、再び端末側に戻す。Webサイトの閲覧履歴など端末側のデータそのものをサーバーへ送らないため、プライバシーを保護しつつAI(人工知能)を効率的に学習させられるとされる。

 「利用者をWeb上の群衆の中に隠せる」。グーグルはFLoCのプライバシー保護方針をこう表現する。利用者の最近のWeb閲覧履歴に最も近い利用者グループ(コホート)をChromeが自動的に判断し、似た閲覧履歴を持つ数千人から成るコホートへと利用者を割り当てる。利用者がグーグルや一般のWebサイトと共有するのはコホートの情報のみで、Web閲覧履歴そのものは端末側だけに保存する。

コホートの例
コホートの例
(出所:米グーグル)
[画像のクリックで拡大表示]

 さらにグーグルは「機密性が高くセンシティブな話題を含むと判断されるグループを作成しない」としている。具体的には病気や医療関連、政治、宗教などの話題を含むWebサイトが対象だ。ChromeはコホートIDを計算する際に、利用者が高い確率でこれらのサイトを訪れていると判断したらこのコホートが使われないようブロックする。

 グーグルが広告主企業とともにFLoCによるコンバージョン率(購入やアプリのダウンロードなど何らかの行動に至った割合)を検証したところ、投資1ドル当たりのコンバージョン率はクッキーに基づく広告の95%以上を見込めると分かったという。同社は条件によって結果は変わると断ったうえで、「検証結果とソリューションが一般の利用者や(メディア企業やコンテンツ配信企業などの)パブリッシャー、広告主に提供する価値に大きく期待している」と説明する。

ブラウザー上で軽量動作

 FLoCはまだ開発途上で詳細な仕様は固まっていない。グーグルが公表しているホワイトペーパーなどから、基本的な仕組みを読み解く。

 グーグルはFLoCのホワイトペーパーの中でコホートの要件を挙げている。例えば各コホートはWebサイトの閲覧行動の似た利用者で構成すること、コホートの識別情報であるIDはクロスサイトトラッキング(サイトを横断した利用者の追跡)に使わないこと、コホートを割り当てるためのアルゴリズムが明確で中身を説明しやすいこと、動作するWebブラウザーのシステム要件が少なくて済むようにコホートの計算が簡単であること、といったものだ。

 これらの要件を満たすため、グーグルはコホートIDの計算にハッシュ計算手法の一種「Simハッシュ」を使う。ホワイトペーパーにおいて同アルゴリズムは「重複している文書を迅速に発見することを目的として開発された」としている。「他の利用者の情報を知らなくてもクライアント側でコホートIDを計算でき、(中略)同じコホートは類似した利用者で構成されることを保証する」とも説明している。