PR

1. はじめに

 本論文では,筆者らが業務として取り組んでいる,ビッグデータ価値化への挑戦に関する活動について,副作用マイニングと着陸誘導システムの異常検出という具体的な二つのタスクを題材に,プラクティカルな面に重きをおいて紹介する.

 近年,大量のデータから価値ある情報を抽出し,実社会で活用する試みが極めて盛んになり,ビッグデータというキーワードとともに一つの潮流となっている.例えばEコマースの分野では,大量の購買履歴データからユーザの購買行動に関する傾向等を抽出し,商品推薦に活用することは既に広く実用化されているし,インターネット上の大量の書き込みを分析することにより,マーケティング関連の知見を抽出するサービスも商用化されている.一方,大量のヘルスケアデータを分析することによる医療や保健に関する知見抽出の試みや,機械や工場等の挙動をセンサによって大量収集したデータを分析することによる自動監視や制御の試みも広く実施されている(例えば,参考文献1)や2)).

 これらの試みの多くにおいては,機械学習に基づくデータマイニングのアプローチが採用されている.そこでは大まかに1)各種分析処理がうまくいくように生データを整形・変換する,2)変換後のデータ中で成立している法則や傾向・パターンを機械学習技術により自動抽出する,3)抽出した法則やパターンを利用して,数値予測やカテゴリ判別,異常検出や制御といった顧客価値を実現する,といった分析プロセスが踏まれる.1)で生成される2)の入力データは属性データと呼ばれる.

 機械学習に基づくアプローチによるビッグデータ価値化の取り組みとは,具体的な案件に対して上記1),2),3)の分析プロセスを適切に設計することに尽きる.その成功のためには,単なる分析技術的な側面にとどまらず,適用分野の背景知識を踏まえた適切な問題構成や,現実的なコストの下でのデータ準備や評価といった実務的な側面も非常に重要となる.以下,第2章では薬剤の副作用分析,第3章では航空機着陸システムの安全性設計といった全く異なる分野のタスクを題材に,プラクティカルな視点から筆者らの経験を記述する.また最後に第4章で,これらに共通する課題の整理に挑戦する.