全1557文字

 ディープラーニングのための数学をどう学ぼうか困っていた筆者。窮地を救ってくれたのは1冊の書籍だった。元高校の数学の先生が書いた『ディープラーニングがわかる数学入門』(技術評論社)だ。そのままずばりのタイトルである。悩んでいるのはみんな同じなのだ。

勉強のために読んだ本。中央が『ディープラーニングがわかる数学入門』
勉強のために読んだ本。中央が『ディープラーニングがわかる数学入門』
(出所:深田 理加、以下同じ)
[画像のクリックで拡大表示]

 この本は2つの点で、理解の大きな助けとなった。

 1点目は、ディープラーニングを構成する「活性化関数」と「誤差関数」が具体的にどういう計算を行っているかが、例題を通して詳しく書かれていた点である。ごく簡単に言えば、活性化関数は「層の間をどのように電気信号を伝播させるかを調整する関数」(『ディープラーニングG検定公式テキスト』p.103)であり、誤差関数は「モデルの予測値と、実際の値との誤差(同、p.144)を計算するときに使う関数だ。