PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 画像中に写っている物体のラベル(種類)を推定する「一般物体認識」など、画像認識分野で認識率の大幅な向上をもたらしたディープラーニング。画像認識に用いる場合は、CNN(convolutional neural network)という構造のディープニューラルネットワーク(DNN)を用いることが多い。

 このCNNについて、新しい成果が出てきた。動画像(映像)の認識である。CNNの考案者であるディープラーニングの著名研究者、Yann LeCun氏が在籍する米Facebook社 AI Researchなどの研究グループが2015年10月、動画像の認識に向いたCNN「3次元(3D)CNN」を発表した1)