全3261文字
PR

みなさんはAI(人工知能)に対してどんなイメージを持っているでしょうか。興味はあるけど難しそう、ブラックボックスでよくわからない──。そんな印象を持っている人は少なくないのではないでしょうか。そこで本特集では人気ブロガーからあげ先生が「Google Colaboratory(Google Colab)」という無料のクラウドサービスを使った実習を通じて、AIを用いた姿勢推定技術について楽しく解説していきます。

 前回までで、姿勢推定技術の高い性能を体感できたと思います。姿勢推定技術は、自分でモデルを作って学習させるのはハードルが高いので、ここからは、姿勢推定技術を応用したAIアプリケーション開発にチャレンジしてみましょう。具体的には、姿勢推定技術で自分がVTuberになれるようなAIアプリを開発したいと思います。

 どんなにすぐれたAI技術でも、それ単体では大きな価値を発揮できないことがほとんどです。学習したモデルを活用した役に立つ・面白いAIアプリを作ることで高い価値が生まれます。

 AI技術を活用したアプリケーション開発は、そのような高い価値を生み出すことのできる重要な技術となります。ぜひそのエッセンスを身に付けてください。

 今回作成するAIアプリの実行結果を先に示しておきましょう。以下のように、人の動きに合わせてVTuberが動き出します!

[画像のクリックで拡大表示]

姿勢推定技術ソフト「tf-pose-estimation」の仕組み

 本特集1回目に、姿勢推定技術の概要を説明しましたが、ここでは、今回使用する「tf-pose-estimation」が、どのような動きをするのか、コードを見ながら説明していきます。

 「tf-pose-estimation」で前回試した姿勢推定のデモでは、撮影した写真に対して、下のようにまず身体の部位を推定し、次に部位間をつなぎます。

[画像のクリックで拡大表示]

 具体的には、以下の流れを繰り返すことになります。

  1. 画像を取得
  2. 人物ごとの身体の主要部分(キーパーツ)の位置情報を取得
  3. 人物ごとにキーパーツをつなぐ

 「tf-pose-estimation」で姿勢推定に使うコードのほとんどは「tf_pose」というディレクトリの中のファイルに書かれています注1

注1 Google Colab のページの左端にあるフォルダーアイコンをクリックするとディレクトリやファイルの一覧が出ます。「tf-pose」を開いて各ファイルをダブルクリックすれば閲覧できます。