全1825文字
PR

 IoT(インターネット・オブ・シングズ)機器からデータを収集し、AI(人工知能)で分析する――。企業がデジタルトランスフォーメーション(DX)に取り組むなか、こうしたデータの利活用が進んでいる。

 厄介なのはデータ分析の「前処理」にかかる時間がばかにならないことだ。多種多様なIoT機器から送られてくるデータはフォーマットも様々でそのまま分析に使えない。結果的に分析の「前」にデータの欠損を補ったり、フォーマットをそろえたりする「データクレンジング」処理が必要となっている。

 「データサイエンティストが前処理に費やす時間は分析作業全体の8割といわれている」。日立製作所の足達直アプリケーションサービス事業部サービスソリューション本部デジタルソリューション推進部主任技師は困った現状をこう説明する。

使えば使うほど賢くなる

 こうしたなか、日立製作所はデータクレンジング処理の効率を高め、データサイエンティストが本来の分析業務に注力できるようにするWebサービスを開発した。2019年10月2日に提供を始めた、データ前処理の新サービス「Data Preparation Service」である。

 データクレンジングに関する製品・サービスは他社も提供している。日立の新サービスが差異化できるポイントについて、足達主任技師は「AI」を挙げる。「データの特徴や関連性をAIで分析している。統合時に統合できるカラムなどを画面に表示することで、目的のデータを素早く用意できるようになる」(足達主任技師)。

 具体的にはData Preparation Serviceが搭載するデータプロファイルと呼ばれる機能だ。AIがデータの特徴や傾向を解析し、その結果を表示したGUI画面上で不要なデータを取り除いたりフォーマットを統一したりできるようにする機能である。数値データから速度や緯度経度といった項目名を推定することも可能だ。

不要なデータなどを可視化するデータプロファイル機能
不要なデータなどを可視化するデータプロファイル機能
(出所:日立製作所)
[画像のクリックで拡大表示]