PR

 これまで2回に分けて、社会インフラの管理におけるセンサー情報の利活用の方向性を考えてきた。今回は、「ビッグデータ」(これまでのようなデータベース管理では取り扱うことができない極めて大量のデータ)と、代表的なデータ活用技術である「データマイニング」技術について紹介しながら、そのインフラ維持管理への活用について考えたい。

 ビジネスや生活の中で流通する電子データ量は爆発的に増加している。米国IDCは、2009年に0.8ゼタバイト(8000億GB)であった生成データ量が、2020年には35ゼタバイトにまで達すると予測している。また、矢野経済研究所は、2020年には、ビッグデータに関する市場規模は1兆円を超えるという推計を発表している。

 社会インフラの維持管理データはもちろん、スマートグリッドやデジタルサイネージ、プローブカー・システム(自動車をセンサーとして情報を収集するシステム)といった新しい取り組みにより、都市の中で流通するデータが爆発的に上昇していくことが予想されている。ビッグデータ技術はスマートシティのインフラに活用されていくだろう。

ビッグデータの活用技術 ~データマイニング~

 大量のデータを従来の分析手法で活用することには限界がある。そこで活用が期待される手法の一つが「データマイニング」である。データマイニング手法は、一言でいうと、統計解析や機械学習の手法を用いた「仮説発見型」の分析手法のことだ。

データマイニング手法により、効率的・効果的な分析が可能に。(第11回インフラ・イノベーション研究会「ビッグデータ時代に求められる データ解析技術とその活用事例(ブレインパッド 宍倉剛氏)」資料)
データマイニング手法により、効率的・効果的な分析が可能に。(第11回インフラ・イノベーション研究会「ビッグデータ時代に求められる データ解析技術とその活用事例(ブレインパッド 宍倉剛氏)」資料)

 従来の集計分析や経験則に基づく「仮説検証型」の分析アプローチと比べて、仮説発見型には以下のような利点がある。

 従来の「仮説検証型」で、例えば消費電力量の予測をする場合、外気温・湿度・天候の情報(予測含む)などの要因(パラメーター)を軸に、曜日・時間帯、イベント、地域、人口(昼・夜)などの要因との関係性をクロス集計などで把握する。このやり方だと、ある切り口(軸の設定など)で良い結果が得られなかった場合は、分析の切り口を変更して、再度同じ作業を繰り返さなければならず、消費電力量予測のように要因が多い場合は特に分析者の負荷は大きくなってしまう。また、分析の切り口の設定が分析者に依存するため、分析者によって結果にバラツキが発生することが懸念される。

 一方、「仮説発見型」は、対象データを分析者の視点で先に分類するのではなく、例えば、「ある消費電力量を超えるケース」というような分析目標を設定し、その目標を満足するための要因データ間の相関を見つけていくという、いわば逆引きで処理をする手法だ。データ相互の強い関係性を相関ルールとして抽出するデータ分析技術であり、膨大な相関関係の情報の中から重要な情報のみを抽出することが可能となる。同時に分析時間の短縮や、分析者のスキルに依存せずに常に安定的な結果を得ることができるといったメリットがある。

 データマイニング手法は、大きく「確率予測」「分類」「パターン分析」「将来予測」及び「テキストマイニング」と分類される。この手法は、上述した通り、多種・大量なデータ分析に適した手法であり、効果的な広報戦略や気象情報による集客予測など、ビッグデータをビジネスに活用するにあたり、広く活用されている。

データマイニング手法の特徴(第11回インフラ・イノベーション研究会「ビッグデータ時代に求められる データ解析技術とその活用事例(ブレインパッド 宍倉剛氏)」資料)
データマイニング手法の特徴(第11回インフラ・イノベーション研究会「ビッグデータ時代に求められる データ解析技術とその活用事例(ブレインパッド 宍倉剛氏)」資料)

インフラ 維持管理における現場データの活用

 インフラ施設管理者が保有する施設点検データ量は膨大だ。そもそも、損傷に関連する要因は、古さや構造形式・部位、設置地域や気候などの環境など多種・多様であり、必要な要因を抽出し、分析の視点を見出すのは難しい。

 仮説発見型のデータマイニングは、例えば、構造物の損傷が出やすい構造・部位、損傷を受けやすい条件などを捉えるのに有効だろう。

 以下、東京大学大学院社会連携講座の取り組み事例を紹介し、インフラの維持管理へのデータマイニング手法適用の可能性について考える。