PR

 ビッグデータ分析で注目されるITツールといえば、データベースや分析ソフトですが、これだけでは十分ではありません。データ分析結果を改善活動につなげるには、データサイエンティストが導いた分析結果を、利用部門の担当者でも分かりやすい形式で“見える化”しなければなりません。そのための可視化ツールが、今後はより重要になります。

 データサイエンティストの間で注目されている可視化ツールが、CytoscapeとGephiです。いずれも、データ分析結果をビジュアルなネットワーク関係図の形式で表示する機能を備えたOSS(オープン・ソース・ソフト)です。ネットワーク関係図は、物事の相関関係を直観的に把握できるよう、複数の円形を線で結び、関係性の強さに応じて太さや長さを変えて表現したものです。

 Cytoscapeは元々、生物学的なネットワーク(遺伝子やたんぱく質の相互作用)を可視化するためのツールです。Gephiは、多様なネットワーク関係図を高解像度でグラフィック表示できることや、Cytoscapeよりも新機能の開発速度が早いという特徴があります。国内の知名度は高くないOSSですが、既に花王はCytoscapeやGephiをデータ分析業務に活用しています。

 「可視化ツールを用いて、多種多様なデータの関連性を美しいネットワーク関係図で見ると、これまでにない“気づき”を得られる」。NRIワークプレイスサービスのデータサイエンティストである正路章子インフォメーションサービスグループ副主任はこう指摘します。