全1991文字
PR

 システムを内製化する動きが、AI(人工知能)モデル開発に拍車をかけている。多くの企業が独自のAIモデルを開発し、画像を分析して社内の業務を効率化したり売り上げを予測したりしている。背景には米Microsoft(マイクロソフト)や米アマゾン・ウェブ・サービス(AWS)、米Google(グーグル)などが提供する追加学習型クラウドAIサービスの台頭がある。AIの専門知識がなくても独自のモデルを内製開発できるのが売りだ。

 各社のサービスを利用して開発できるAIモデルの種類は幅広い。冒頭に述べたような画像認識や売り上げ予測、自然言語処理などのモデルを、しかもノーコードで開発できる。これまでは自社の業務に特化した独自のAIが欲しければ、スクラッチで最初から開発するしかなかった。

米アマゾン・ウェブ・サービスが提供する「AIサービス」(追加学習型クラウドAIサービス)の種類の一部
米アマゾン・ウェブ・サービスが提供する「AIサービス」(追加学習型クラウドAIサービス)の種類の一部
(出所:米アマゾン・ウェブ・サービス)
[画像のクリックで拡大表示]

 だがベンダーのいう通り、本当にAI開発の経験や知識がなくても独自のモデルを開発できるのだろうか。

開発工程のほとんどを自動で実行

 追加学習型クラウドAIサービスの多くは、ベンダーがあらかじめ「深層学習」で構築したモデルを利用する。深層学習は機械学習の方法の1つであり、同サービスのユーザーは同じく機械学習の方法の1つで、学習データと正解を合わせる「教師あり学習」でモデルに追加学習させる。画像認識モデルの開発を例に取ると、猫が写っている画像データが学習データとなり、猫の画像データに付けた「猫」というタグを正解として、それぞれ学習させる。

 一般的に教師あり学習のAIモデル開発の工程は、大きく分けて「データの準備」「モデルの開発」「モデルの運用・保守」という3つのフェーズからなる。

 まずモデルの学習や精度の評価に使うためのデータを用意する必要がある。画像認識モデルの開発を例に取ると、識別したい対象の画像を用意したうえで、その画像に写っている物体にタグを付けるアノテーションという作業が必要だ。データの数は数千の単位で必要なケースも少なくない。

 次に、用意したデータを用いてモデルを構築する。学習においてどのようなデータのどの特徴に着目して学習するかを指定するための特徴量を設定したり、アルゴリズムの挙動を制御し学習効率を高めるためのハイパーパラメーター(モデルの構造を決める数値)を調整したりする必要がある。モデルが出来上がったら、用意したデータを使って精度を評価し、運用・保守のフェーズに入る。

 深層学習でモデルを構築している追加学習型クラウドAIサービスは、この3つの工程のうちモデルの開発工程を自動化する。つまり特徴量やハイパーパラメーターなどに対する知識がなくてもモデルの開発は可能だ。一方で開発に必要なデータの準備や運用・保守はユーザー自身が責任を持つことになる。

教師あり学習によるAIモデル開発の工程。枠線で囲んだところがユーザーが把握すべき範囲
教師あり学習によるAIモデル開発の工程。枠線で囲んだところがユーザーが把握すべき範囲
(出所:日経クロステック)
[画像のクリックで拡大表示]