PR

AI(人工知能)を使ったシステム構築の中核となるのが、機械学習を使ったモデルの構築だ。数え切れないアルゴリズムが登場する中、どのように適切なアルゴリズムを選ぶのか。今回は構造化データに対するアルゴリズムについて説明する。

 本連載では第1回で、一般的な情報システムとの違いから「AI(人工知能)とは何か」について説明し、第2回では、AIの構築イメージの概要を示すとともに「モデルの精度検証」というAIシステム特有の分析プロセスがあることを説明しました。そこで今回から3回にわたって、AIの「中身」ともいえるモデルを構築するためのアルゴリズムについて、どのような種類があり、何に生かせるのかということを説明していきます(図1)。

図1 今回の連載で取り上げる範囲
図1 今回の連載で取り上げる範囲
[画像のクリックで拡大表示]

 今回はまず、数字や記号に整えられたデータ、つまり「構造化データ」に限ってアルゴリズムの使い分けのポイントを説明します。次回は、今回示した使い分けについて、代表的なアルゴリズムをもう少し掘り下げて説明するとともに、ごく簡単な例を基にモデル作成のケースをストーリー形式で説明します。ここで、実際のAIを使ったシステムの設計で、アルゴリズムをどのように生かしていくかを解説します。

 そして第5回では、画像や音声、文章といった数字・記号に整えられていない「非構造化データ」に対するアルゴリズムを紹介します。

 ここまでアルゴリズムの基礎知識について、じっくりと説明するには訳があります。読者の皆さんは「手っ取り早く、AIを使ったシステム構築のポイントだけを知りたい」と思うかもしれません。ところがAIを使ったシステム構築には、以下のようなポイントを理解することが必要になります。

  • AIシステムの構築では、データの蓄積とそれに基づくアルゴリズムの定期的な「洗い替え(モデルマネジメント)」が重要になる。そのためには概念設計レベルで運用構想が必要となる
     
  • AIの活用にはデータが重要である。とはいえ、単なる蓄積用のデータと各アルゴリズムに学習させるためのデータセットは異なる。そこで、データセットのカラム定義時に「どれだけデータを増やせるか」がカギとなる
     
  • データ量だけがAIの精度に貢献するわけではない。「3V(Volume=量、Variety=種類、Velocity=更新頻度)」などの観点によるデータ品質評価や、「現在ないデータの定義」が推奨される

 これらのAIシステムの構築における重要なポイントは、通常の企業システム構築とは大きく異なります。AIに初めて触れる方にとって、具体的にイメージするのは、なかなか難しいものです。

 利用する要素技術についてある程度理解しておかなければ、システム設計を行うことは簡単ではありません。これは一般的な企業システムの開発と同様です。一般的な企業システムの場合、システム設計にはデータベースやセキュリティの技術、プログラミング言語の違いや制約などについてある程度の理解が必要です。

 同様に、AIを用いたシステムの設計においても、ある程度の要素技術の理解は必要なのです。そこでAIシステム構築の中心であるアルゴリズムについて、じっくりと理解することが重要になってきます。

 今回は正確さよりも分かりやすさを優先しました。そのため、一般的な機械学習技術などの説明とは細部で異なる部分があるかもしれません。本連載では正確な一方で難しすぎてわからない説明よりも、厳密な定義とは若干異なる部分があっても理解可能な説明を優先するという執筆方針で臨んでいることをご了承ください。

この記事は有料会員限定です

「日経SYSTEMS」定期購読者もログインしてお読みいただけます。

日経クロステック有料会員になると…

専門雑誌8誌の記事が読み放題
注目テーマのデジタルムックが読める
雑誌PDFを月100pダウンロード

有料会員と登録会員の違い