全2717文字
PR
『金融AI 成功パターン』
『金融AI 成功パターン』

金融業務へのAI(人工知能)適用に関するノウハウを「パターン」として整理した『金融AI成功パターン』(日経BP、2023年)では、7つの基本パターンと、5つの上級パターンを紹介している。同書からさまざまな場面に適用できるノウハウとして、本連載では機械学習の基本とライフサイクルを取り上げ、連載の後半では「7つの基本パターンの概要」を抜粋して解説する。今回のテーマは「機械学習ライフサイクルの(3)モデリング・(4)精度評価」である。(技術プロダクツユニットクロスメディア編集部)

 金融機関におけるビジネス的なAI(人工知能)活用では、教師あり学習を中心に考えていけば多くのテーマに対応することができますので、教師あり学習のライフサイクルを紹介します。教師あり学習のステップは、一般的に下記のような流れになります。

  • (1)テーマの決定
  • (2)学習データの準備
  • (3)モデリング
  • (4)精度評価
  • (5)機械学習モデル解釈
  • (6)デプロイ
  • (7)運用監視
  • (8)再学習・切り替え

 今回は(3)モデリングと(4)精度評価について説明します。

(3)モデリング

 データ準備が完了すれば、学習データに対して機械学習アルゴリズムを実行します。二値分類問題や回帰問題などそれぞれの問題タイプに対応したアルゴリズムは決まっているため、対応しているアルゴリズムをまずはリストアップします。その上で、データの特性に照らして、線形系の機械学習アルゴリズム、ツリー系の機械学習アルゴリズム、ディープラーニング系の機械学習アルゴリズムの中から候補を選択します。

 機械学習アルゴリズムにはさまざまなタイプがあるため、複数試して比較します。このとき、各機械学習アルゴリズムには、ハイパーパラメーターと呼ばれる機械学習アルゴリズムの学習の仕方を調整するパラメーターが存在するため、それをさまざまなパターンで試し、チューニングを施す必要があります。ハイパーパラメーターが1種類しかないような機械学習アルゴリズムもあれば、数十を超えるハイパーパラメーターを持つ機械学習アルゴリズムもあります。

 チューニングが終わり、特性は違うが精度の良い機械学習モデルが複数できれば、それらをアンサンブル(合体)させることによって、元の機械学習モデルのいいとこ取りをした機械学習モデルを作成することもあります。アンサンブルの手法も平均を取るだけのもの、もう1段階機械学習アルゴリズムにかけるものなど、いくつかの種類があります。どの組み合わせの機械学習モデルをどの手法でアンサンブルすることが最も良いのかなどを考える必要があります。

 機械学習アルゴリズムを実行する上では、各機械学習アルゴリズムの特性、特徴量エンジニアリングの手法ごとの差、ハイパーパラメーターの意味、アンサンブル手法を理解し、さまざまな組み合わせを試行錯誤して試していく必要があり、膨大な時間がかかる上に、深い数学・統計学・機械学習自体の知識が求められてきました。

 最近では、自動機械学習(AutoML:Automated Machine Learning)によって大部分が自動化されているため、ビジネスにおいて機械学習を利用する分には、従来求められたほどの深い知識がなくとも、モデリングをすることができるようになっています。一方で、それぞれの機械学習モデルもしくはアンサンブルの結果には、利点もあれば欠点もあるので、結果を妄信しないための最低限の知識が必要であることは言うまでもありません。