大手クラウドベンダーは学習済みの汎用的な機械学習モデルに追加学習させるタイプの人工知能(AI)開発支援・実行サービスを提供している。いわば「追加学習型クラウドAIサービス」だ。このサービスを活用すれば、独自のモデルを少ない工数で比較的容易に開発できるという。実際にはどうなのか。今回はフジテレビの事例を通して探る。
「追加学習させたのは、対象人物1人当たり5枚ほどの画像だけ。それで実用レベルの人物判定モデルをつくれた」。こう話すのは、フジテレビの白坂典義技術局技術開発部主任だ。
フジテレビは大手パブリッククラウドサービスのAmazon Web Services(AWS)とGoogle Cloudがそれぞれ提供する追加学習型クラウドAIサービスを活用し、人工知能(AI)を組み込んだ業務システム「メタロウ」を開発して運用している。
メタロウは報道やドラマといった番組アーカイブの整理情報「メタデータ」の作成を支援するものだ。番組映像に対して、出演している人物の氏名やコーナー名などを出力する。これらはメタデータの一部になる。
メタデータは放送内容や出演者の氏名、番組を企画したプロデューサーの氏名、番組内で使用した楽曲など多岐にわたり、従来は担当者が全て手作業で入力してきた。作業負担が重い上に、番組によって作業量のばらつきが大きかったという。メタロウによって、この作業を部分的に効率化する。
メタロウは現在バージョン1(v1.0)を本稼働させており、バージョン2(v2.0)が実証段階にある。v1.0はAWSの「Amazon Rekognition」を活用し、フジテレビが放送する番組映像からリアルタイムに人物を判定し氏名を出力するもの。v2.0はRekognitionとGoogle Cloudの「Cloud Vision API」の両方を活用しており、番組のアーカイブ動画を読み込ませると、出演している人物の氏名やコーナー名などを出力する。