全2070文字
『金融AI 成功パターン』
『金融AI 成功パターン』

金融業務へのAI(人工知能)適用に関するノウハウを「パターン」として整理した『金融AI成功パターン』(日経BP、2023年)では、7つの基本パターンと、5つの上級パターンを紹介している。同書からさまざまな場面に適用できるノウハウとして、本連載では機械学習の基本とライフサイクルを取り上げ、連載の後半では「7つの基本パターンの概要」を抜粋して解説する。今回のテーマは「機械学習の種類」である。(技術プロダクツユニットクロスメディア編集部)

 機械学習は、機械学習アルゴリズムと機械学習モデルという2つの概念に分けることができます。データに対して複数の機械学習アルゴリズム(ディープラーニングや勾配ブースティング、ランダムフォレストなど)を走らせることによって、機械学習モデルと呼ばれるロジックの塊が生成されます。

 このデータに対して機械学習アルゴリズムを走らせて機械学習モデルを構築することを「学習」と呼び、その流れからこのとき利用されるデータを「学習データ」と呼びます。作成された機械学習モデルに対して、運用時にデータを入力して分析結果を出力させることを「予測させる・推計させる」などと表現します。併せて、このときのデータを「予測データ」と呼ぶことが多いです。

 機械学習には、大きく「教師あり学習」「教師なし学習」「強化学習」の3種類が存在します。金融機関で利用するAI成功パターンで登場する機械学習のほとんどは、教師あり学習という機械学習手法です。

 教師あり学習が対応する問題にはYesかNoを判定する「二値分類問題」、数値を推計する「回帰(連続値)問題」、AかBかCかなど、どのクラスか判定する「多クラス分類問題」、AまたはBまたはCのラベルが0ないし、どれだけ付くかを判定する「多ラベル問題」があります。さらに、これらに追加して、分類や回帰を時系列順に予測する「時系列分類問題」や「時系列回帰問題」が存在します。