PR

エッジ側で深層学習

 深層学習を活用するためのプラットフォームは他社にもある。それらと比べたDIMoの特色は、ネットワークのエッジ側でも処理を実行できることと、常に最先端のアルゴリズムを活用できることである。

 既存の深層学習プラットフォームやミドルウエアの多くは、主にクラウド上での利用を前提としている。公開されたAPIを通して、画像認識や音声認識などに特化した高精度な学習済みモデルを提供するものが多い。これに対してDIMoは、ネットワークのエッジやフォグで発生するストリームデータに対して、学習済みモデルを直接適用する手段を提供する。我々が以前から提唱してきた「エッジヘビーコンピューティング」1)を実地に移した格好である。

 学習済みモデルを使った認識や予測を、エッジ側で実行する利点はいくつもある。まず、データを発生源で直接処理することで、抽出した重要な情報やイベントだけをクラウドに送ることが可能になる。例えば監視カメラで重要なイベントが生じたときだけ情報を送ったり、映像中の人数や各人の属性の推定情報といったメタ情報のみを送信したりできる。

 こうすればネットワーク帯域や通信量を削減できる上、不要になったデータを逐次破棄できるのでプライバシーに配慮しやすくなる。クラウドへの問い合わせにかかる時間が減るので、低遅延のフィードバックによる機器制御にも適用できる。なお、現状でエッジ側に想定しているハードウエアはRaspberry PiやGPU搭載パソコンなどで、組み込み機器への対応は今後検討する。

最新成果を継続的に反映

 最先端のアルゴリズムを常に利用できるのは、我々が開発した最新の成果を継続的に反映するからである。深層学習技術は日進月歩で進化しており、新たなニューラルネットワークのモデルや学習手法を取り入れることで、認識率や予測精度はさらに高まる。例えば、人物検出の見逃し率を1/3(33%)まで低減できる深層学習アルゴリズムを採用したあと、さらに新しい深層学習手法を用いて見逃し率を1/4(25%)まで抑制できたことがある。我々は各業界の先進企業と深層学習の研究開発を進めており、その中でできあがったアルゴリズムを他分野にも適用できるように汎用化してDIMoに組み込んでいく。

 現在のDIMoは、我々の構想のごく一部を実装したにすぎない。最終的なゴールは、エッジ、フォグ、クラウドを横断して、機器同士が協調動作する賢いシステムの実現である1)。局所的なデータを効率的に処理できるエッジ、広域から集まったデータを俯瞰的に処理できるクラウド、そしてその中間的な特性を持つフォグがそれぞれ自律的に行動した結果、互いに補完し合って全体を最適化できるシステムが、自動的に形成される将来を想定している。深層学習は、この構想を実現する鍵を握る技術と考えている。