PR

動画やテキストデータといった非構造化データもAI(人工知能)を適用して分析できるようになった。非構造化データを扱う際には一度、構造化データにする方法とそのまま分析する方法の2種類がある。アルゴリズムを選択する際には、現場からの要求を十分に踏まえることが最も重要だ。

 今回はまず、非構造化データを扱うアルゴリズムについて、その概要を説明します。その後、前回紹介した構造化データを扱うアルゴリズムも含め、実ビジネスのプロジェクトで、どのようにアルゴリズムを選定していくのかを事例を挙げて解説していきます。

 これまでは表計算ソフトに入力された売り上げデータのような表(テーブル)形式のデータである「構造化データ」を中心に、アルゴリズムを紹介してきました。しかし近年では様々な形式のデータの取得が容易になったことや、高い処理能力を持つアルゴリズムの開発が進んだことで、画像や音声を扱うAI(人工知能)システムの開発が一般的に行われるようになってきました。画像や音声のように、表形式で表せないデータを「非構造化データ」と言います(図1)。

図1 構造化データと非構造化データ
図1 構造化データと非構造化データ
[画像のクリックで拡大表示]

 以下ではまず代表的な非構造化データについて、その特徴や用途を見ていきましょう。

画像データ

 典型的な非構造化データが、デジタルカメラの写真ような画像データです。3D画像や、書類をスキャンした画像なども画像データです。動画も特殊な画像と考えられます。画像データにAIを適用すると、顔認識を利用して写真に写っている人を特定したり、レジに置いてある商品を判別したり、あるいは文字認識を使って手書き文書をデジタル化したり、といった用途が考えられます。

 では画像データに対して、どのようにAIを適用していくのでしょうか。構造化データのときに紹介したように、非構造化データであっても、基本的には目的変数(予測したい値)がある場合とない場合で、利用するアルゴリズムを整理できます。

 非構造化データにおいて「目的変数がある場合」というのは、「この画像に猫が写っているかどうかを識別する」といったケースです。多くの画像を用意し、「猫が写っている写真」という正解(目的変数)を与えることで、猫が写っているかどうかを識別するモデルを構築できます。一方、目的変数がない場合は、「100枚の画像をいくつかに分類したい」といった利用方法が考えられます。

 先ほど述べたように、動画は特殊な画像データの1つです。例えばテレビは1秒間に30回の画像を表示することで、連続した画像に見えるように構成しています。そのため動画の処理の実態は、画像データの処理を数多く実施していることになります。

 動画データのAI適用例は、登録された人以外が監視カメラに写っているかどうかを識別することで不審者を検出したり、製造ラインから不良品を検出したり、車載カメラから衝突の確率を予測したり、といったものがあります。

 画像データにAIを適用する際には、多数の画像を処理する点に注意が必要です。リアルタイムのレスポンスが求められる場合、画像1枚1枚を高速に処理するモデルの応答速度が問題になります。

音声データ

 音声データは、AIスピーカーなどの音声入力デバイスが普及してきたこともあり、当社のAI担当チームへの問い合わせも増えるなど注目されています。

 音声データは波形で表せます。この波形のデータを用いて、例えば低音域の特徴から話者の感情を推定したり、何を話したかを文字起こしをしてテキストデータとして利用したりすることが行われています。

 音声データの実用例は、コールセンターなどでの応答記録を自動でテキスト化したり、話者の感情を推定したり、などが有名です。機械の異常を音から検知する、といった利用方法もあります。

フリーテキストデータ

 フリーテキストデータは、小説のような長い文章から、ツイッターでのコメントやアンケート調査の自由記述欄のような比較的短い文章まですべてを含みます。

 非構造化データの中でも古くから活用されているデータです。当然のことながら英語や日本語といった言語の違いによって、データ処理の方法が異なります。また、社内用語や専門用語が多様されているようなフリーテキストデータの場合、社内用語や専門用語を定義する必要があるなど、精度の高い分析を行おうとするとかなりの技術が必要になります。

 テキストデータの実用例には、ツイッターなどのデータを利用したブランドの評判分析や、要約生成技術による議事録・日報の自動作成などがあります。近年では、自動翻訳技術も多く活用されるようになってきています。

センサーデータ

 最近多く用いられるようになった非構造化データに、センサーからのデータがあります。ここでは、工場の機械に取り付けられた振動計などのデータをイメージしてください。センサーデータを利用する際には、「3秒周期で振動する波の大きさ」といった形に処理してから分析したり、一度グラフを描いてから画像として利用します。

 センサーデータは、製造ラインで機器の異常を検知するために多く使われています。最近ではさらに一歩進めて重要な機器の故障率を予測して部品交換の頻度を最適化するといった使い方が注目されています。製造業ばかりではなく、人間の心拍などをセンサーを用いて取得し、ストレスや疾患のリスクを予測する取り組みも行われています。

 ここ数年でこれまで紹介した非構造化データを、複数組み合わせて活用する事例が増えてきています。購買率を予測するモデルを作成する際に、時間や天気といった構造化データだけでなく、顧客の顔画像を用いることで予測精度を向上させる、といった取り組みです(図2)。

図2 非構造化データの利用によるデータ活用の高度化例
図2 非構造化データの利用によるデータ活用の高度化例
[画像のクリックで拡大表示]

 こうした非構造化データの活用方法は、一般的となってきました。そのほか、動画を入力するとその説明文を生成するといったものや、洋服などのデザイン画を入力すると類似したデザインを10個自動生成する、といった実例もあります。

この記事は有料会員限定です

「日経SYSTEMS」定期購読者もログインしてお読みいただけます。

日経クロステック有料会員になると…

専門雑誌8誌の記事が読み放題
注目テーマのデジタルムックが読める
雑誌PDFを月100pダウンロード

有料会員と登録会員の違い