PR
写真1●米リンクトインでデータサイエンティストを率いるSimon Zhang氏
写真1●米リンクトインでデータサイエンティストを率いるSimon Zhang氏
[画像のクリックで拡大表示]
写真2●伝統的なアナリティクスの手法
写真2●伝統的なアナリティクスの手法
[画像のクリックで拡大表示]
写真3●処理内容を見直すと同時に下位レイヤーでデータ処理の自動化を促進
写真3●処理内容を見直すと同時に下位レイヤーでデータ処理の自動化を促進
[画像のクリックで拡大表示]
写真4●今後は、予測立案からデータマネジメント、分析、洞察、決定・行動までの一連の流れを繰り返すようにする
写真4●今後は、予測立案からデータマネジメント、分析、洞察、決定・行動までの一連の流れを繰り返すようにする
[画像のクリックで拡大表示]
写真5●4種類のデータの量と複雑さを示したグラフ
写真5●4種類のデータの量と複雑さを示したグラフ
[画像のクリックで拡大表示]
写真6●データサイエンティストに求められる資質
写真6●データサイエンティストに求められる資質
[画像のクリックで拡大表示]

 米テラデータは現地時間2012年10月21~25日の会期でデータウエアハウス(DWH)に関するカンファレンス「Teradata PARTNERS Conference & Expo 2012」(以下、PARTNERS)を米国ワシントンD.C.市内のホテルにおいて開催している。PARTNERSは、DWH関連の世界最大規模のカンファレンスの一つで、世界各地のテラデータ製品の利用企業による先進的な事例が数多く発表されるのが特徴。日本からは今回、三菱東京UFJ銀行とニッセンの事例が発表される予定だ。

 21日にはビジネス向けSNSを展開する米リンクトインでデータサイエンティストを率いるSimon Zhang ビジネスアナリティクス部門ディレクターが、「LikedInにおけるデータサイエンティストの分析の進化(Data Sciences and Analytics Evolution)」と題して講演。重要な資産であるデータをいかに分析し、ビジネス成果に結びつけるかを、これまでの分析内容の変遷を振り返りながら解説した(写真1)。

 Zhang氏はまず、リンクトインには現在25人のデータサイエンティストがいることを明らかにし、彼らがより重要なデータ分析作業に従事できるよう、いかに工夫しているかを説明した。

 それによれば、伝統的なアナリティクスでは、五つのレイヤーに分けてデータを分析し洞察を導く手法が主流であり、リンクトインにおいてもそのレイヤーに沿ってデータ分析を行っていた。五つの層は、データレイヤー、BIレイヤー、アドホックアナリシスレイヤー、ディープアナリシスレイヤー、インサイツ(洞察)レイヤーである(写真2)。

 ただし、この手法には、データサイエンティストが下位レイヤーの処理に時間を取られ、洞察を得るための上位レイヤーの処理に注力しづらいという課題があったという。これを解消するために、ビジネスアナリティクス全般における処理内容を見直したうえで(写真3の左)、下位レイヤーについてはデータ処理の自動化を推し進めることで、データサイエンティストがデータ分析に基づいて洞察を導出し、それに基づいた行動を起こしやすい現在の体制を敷いたという(写真3の右)。

 さらに今後は、予測立案からデータマネジメント、分析、洞察、決定・行動までの一連の流れを繰り返すことにより、データの分析精度を高めるようにすることを狙う(写真4)。

 Zhang氏は続いて、「リンクトインにとってのビッグデータとは何か」をテーマに、データの種類に応じてサイズが異なることと、サイズが大きくなるにつれて分析上の複雑さが増すことに言及した。具体的には、ERPデータ(メガバイト級)、CRMデータ(ギガバイト級)、Webデータ(テラバイト級)、ソーシャルデータ(さらに巨大なデータ)という4種類のデータがあるという(写真5)。

 また、これらのデータを特質で分類すると、行動(Behavioral)データ、本人(Identity)データ、ソーシャルデータがあり、それらの特質を用いて処理の高速化を図っていることを説明した。例えば、リンクトインのデータをマーケティングに活用する場合には、行動データ、本人データ、ソーシャルデータの順番にターゲットを絞り込むことで、正確かつ高速に該当人物を導き出しているという。

 講演の最後でZhang氏は、データサイエンティストに求められる資質について語った。それによれば、スキルやスマートさが資質に占める割合はそれぞれ5%、15%しかないという。資質の85%を占める情熱を備えていてこそ、よいデータサイエンティストになれるとした(写真6)。

 さらにZhang氏は、より良いデータサイエンティストになるためには、データ分析の力を信じることが不可欠であることを強調した。「データサイエンティストがデータ分析の威力を信じていなければ、それに基づいて現場の人々を動かすことはできない」と述べ、1時間の講演を終えた。