PR
図●特徴量自動設計技術の概要(出典:NEC)
図●特徴量自動設計技術の概要(出典:NEC)
[画像のクリックで拡大表示]

 NECは2015年8月18日、ビッグデータの予測分析にかかる時間を短縮する新技術「特徴量自動設計技術」()を開発したと発表した。予測に役立つ特徴的なデータ(特徴量)を、分析技術者に代わって自動的に見つけ出す。NECの実証実験(三つのビルの電力需要予測)では、分析技術者が人手で設計した場合に3カ月かかっていた処理の期間を、同等の精度で3分の1の1カ月に短縮できた。同技術は、2015年度中に実用化し、各種のパッケージシステムに含めて提供する予定。

 小売店舗の商品別の予測分析など、大量のデータを分析して将来の傾向を予測するシステムのために開発した技術である。従来、NECでは、データの中に規則性を持った値の固まりが複数存在する時に、これを自動的に場合分けする技術「異種混合学習技術」を提供してきた(関連記事:NEC、ビッグデータで弁当や惣菜の発注量を算出するシステムを販売)。今回の特徴量自動設計技術を使うと、分析の前段階として、特徴量を自動的に生成できるようになる。これにより、小売店舗の売上予測などを、これまでよりも素早くタイムリーに提供できるようになる。

 特徴量とは、ビールの売上に影響を与える特定の気温データ(特定の気温を上回った場合に売上が大きく増える)など、大きな影響を及ぼす条件に当てはまるデータのこと。ビッグデータの予測分析では特徴量を設計して評価する必要があるが、高度な相関分析や人手による検証が必要になるため、これまでは専門ノウハウをもつデータ分析技術者が手動で設計してきた。今回の新技術では、特徴量の生成にかかる一連のプロセスを自動化し、分析期間を短縮する。

 特徴量を自動的に算出するため、「標準化」や「移動平均」(時系列データの平準化)など、データ分析技術者がこれまで多くの経験を通じて培った様々な種類の「データ変換処理」をライブラリ化した。このライブラリを組み合わせることで、多様な特徴量を簡単に生成できるとしている。また、分析対象となる大量のデータに対して「データ変換処理」の組み合わせの中から最も適切な組み合わせを高速に探索する「高速探索アルゴリズム」も開発した。