PR

 2015年現在、世間は第3次人工知能ブームの真っ只中にある。人工知能やその応用に関する記事がWebだけでなく一般紙にも連日のように取り上げられ、人工知能の発展がもたらす社会的変化や未来に関する懸念についても盛んに議論されている。

 そこで中心的な役割を果たしているのが、機械学習であり、特に深層学習(ディープラーニング)に注目が集まっている。深層学習は大規模かつ複雑なニューラルネットワークモデルを効率的に構築するための一連の手法であり、その威力は様々な機械学習の応用分野に広がっている。

 本稿では、Preferred Networks/Preferred Infrastructureが開発したディープラーニングの開発フレームワーク「Chainer」の概要と、Chainerを使ったディープラーニングの構築手法を説明する。

ニューラルネットワークの逆襲

 ニューラルネットワークは第1次人工知能ブームから期待を集めつつも、大規模化の限界や計算機の性能不足によって大きくは成功せず、その後の機械学習の勃興によって歴史に埋没し、忘れられた存在となろうとしていた。

 しかし、10年ほど前から学習の効率化や精度向上に関する研究上のブレークスルーが複数発表されるようになった。それら一連の手法が米グーグルや米マイクロソフトの持つ大量の画像・音声データセットと、豊富な計算機資源と出会うことで2010年ごろから花開き、パターン認識や自然言語処理の多くのタスクにおいて旧来の手法を圧倒する性能を発揮し始めた。

 まさにニューラルネットワークの逆襲とも言うべきその進化は、ビッグデータや機械学習の流行とも相まって、すぐに応用への興味を駆り立てることになる。グーグルや米フェイスブック、マイクロソフトなどアメリカ西海岸の主要IT企業がこぞって深層学習の研究者を集め、自社サービスへの適用を図ってきたのは周知の事実である。

 その波は海を越えて日本にも広がっており、深層学習を用いたサービスの差別化、あるいは新しいアプリケーション誕生への期待が高まっている。