AI(人工知能)の主な用途の1つが、画像処理である。今回は「G検定」合格のために必要な画像処理の技術について、「畳み込みニューラルネットワーク(CNN)」などディープラーニングの代表的な手法を取り上げながら解説する。
例題は、日本ディープラーニング協会(JDLA)監修の『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』(翔泳社、以下「公式テキスト」)掲載の問題を題材とする。
畳み込みニューラルネットワークとは
まず、畳み込みニューラルネットワークに関する例題を見てみよう。
- 畳み込み層とプーリング層で追加される重みのパラメーターは、いずれも誤差逆伝播法において学習することができる。
- 大きなサイズの畳み込み層を1つ追加するより、小さなサイズの畳み込み層を複数追加するほうが、必要な計算量が少なくて済む。
- 畳み込みニューラルネットワークが画像認識について他のニューラルネットワークよりも高い性能を得やすいのは、移動不変性および回転不変性を持つためである。
- 畳み込みニューラルネットワークは、時系列データの分析に用いることもできる。
出所:公式テキストp181 6章 章末問題 問題3