全5499文字
PR

 自社の業務に特化した独自の人工知能(AI)が欲しければ、スクラッチで開発するしかない。そんな常識が覆されようとしている。3大クラウドであるAmazon Web Services(AWS)、Microsoft Azure、Google Cloudがこぞって追加学習型のクラウドAIサービスに力を入れている。

 いずれも学習済みの汎用モデルを用意しており、ユーザーがそれに学習データを投入して追加学習させることにより、独自のモデルをつくることができる。アルゴリズム選定やハイパーパラメーターチューニング(モデルの構造を決める数値の調整)といったAIの専門知識は不要。追加学習のデータを用意するだけで開発できる。テストや本番実行の環境も用意しており、エンジニアとしての経験も問わない。

 クラウドベンダー各社は文章解析やテキストの読み上げといった機能別にサービスを提供している。その中でも利用企業が増えているのが、画像認識のクラウドAIだ。フジテレビジョン、カルビー、建設や農業支援システムなどを手掛けるトーヨーホールディングスの事例から、その実力を探る。

フジテレビジョン
学習させた画像は1人5枚 映像の人物を自動判別

 「追加学習させたのは、対象人物1人当たり5枚ほどの画像だけ。それで実用レベルの人物判定モデルをつくれた」。こう話すのは、フジテレビの白坂典義技術局技術開発部主任だ。

 フジテレビはAWSとGoogle Cloudがそれぞれ提供する追加学習型クラウドAIサービスを活用し、AIを組み込んだ業務システム「メタロウ」を開発して運用している。

図「メタロウv2.0」の画面例
図「メタロウv2.0」の画面例
登場人物などの番組メタ情報を自動生成(画像提供:フジテレビジョン)
[画像のクリックで拡大表示]

 メタロウは報道やドラマといった番組アーカイブの整理情報「メタデータ」の作成を支援するものだ。番組映像に対して、出演している人物の氏名やコーナー名などを出力する。これらはメタデータの一部になる。

 メタデータは放送内容や出演者の氏名、番組を企画したプロデューサーの氏名、番組内で使用した楽曲など多岐にわたり、従来は担当者が全て手作業で入力してきた。作業負担が重い上に、番組によって作業量のばらつきが大きかったという。メタロウによって、この作業を部分的に効率化する。

 メタロウは現在バージョン1(v1.0)を本稼働させており、バージョン2(v2.0)が実証段階にある。v1.0はAWSの「Amazon Rekognition」を活用し、フジテレビが放送する番組映像からリアルタイムに人物を判定し氏名を出力する。v2.0はRekognitionとGoogle Cloudの「Cloud Vision API」の両方を活用しており、番組のアーカイブ動画を読み込ませると、出演している人物の氏名や番組コーナー名などを出力する。

1人で独自モデルを開発

 メタロウのモデルを開発したのは前出の白坂主任である。同氏はもともと番組制作の部署に所属しており、AIの開発経験はなかった。約4年前、現所属の技術局技術開発部に配属された際、AIの活用を進めたいと考えた。

メタロウ開発の指揮を執る、フジテレビジョンの白坂典義技術局技術開発部主任(写真提供:フジテレビジョン)
メタロウ開発の指揮を執る、フジテレビジョンの白坂典義技術局技術開発部主任(写真提供:フジテレビジョン)
[画像のクリックで拡大表示]

 ITベンダーと、AIを組み込んだあるアプリケーションの開発に取り組んだが、実導入に至らなかったという。ベンダーに任せがちだったこともあり、白坂主任は自身でAIの開発経験を積むこともできなかった。

 白坂主任はその後AI開発を独学した上で、メタロウv1.0の開発に取り組んだ。開発には、白坂主任と別のITベンダーのエンジニア4人ほどが参加。メタロウv1.0の中核となるモデルの開発は白坂主任が1人で担当した。

 白坂主任はメタロウv1.0のモデルを開発するため、対象人物となる約1万6000人の画像データをRekognitionに登録し学習させた。「AWSが推奨している通り1人当たり5枚ほどの画像を学習させただけで、真正面から写した映像ならほぼ正確に顔を識別できるようになった」(白坂主任)という。

 ただ映像の顔が真正面向きとは限らない。横顔だったりマスクを付けていたりすると、正しく識別できないケースがあるという。

 メタロウv1.0は対象人物の氏名をアプリ内で確認できる。一方でメタロウv1.0をベースに開発しているv2.0は、識別した人物の氏名をCSVファイルで出力する機能を備える。さらにCloud Vision APIに対して映像の特定の位置を指定することで、コーナー名を識別させる。人物の氏名とコーナー名、それぞれが画面に映り始めた時間、映り終わった時間をCSVファイルで出力する。

 メタロウはメタデータを作成する現場部署から好評を得ているという。今後、メタロウv2.0を実運用に堪えられるよう改良を進める。