PR

 Microsoft社のCatapultでは、米Altera社のFPGAに備わる高速シリアル通信インターフェース「SerialLite(SL)III」を用いて、4近傍のFPGA同士を2Gバイト/秒で直結してある。これに対し、吉永氏らの技術では、アバールデータが開発した独自の光インターフェース「GiGA CHANNEL」(約1Gビット/秒)を用いて、4近傍のFPGAを接続した。

 ストレージは、SAS(Serial Attached SCSI)のSSDをFPGAに直結してある。現状では、ファイルシステムに対応しておらずブロックレベルで直接記録するそうだが、将来的には簡易的なファイルシステムに対応させるとのことだ。

 ちなみに、ビッグデータ処理というと分散クラスターで並列にバッチ処理する「Hadoop」が著名だが、最近はインメモリー処理を基盤にした「Spark」という技術が注目されている。

 機械学習など繰り返し型の演算をビッグデータに対し施す場合、Hadoopではジョブが終了する度にストレージ(HDFS:Hadoop Distributed File System)にデータを書き戻す必要があるが、Sparkではできる限り主記憶上にデータを置くことで、Hadoopと比べて処理を大幅に高速化できるのが特徴だ(関連記事:次世代Hadoop最有力候補の「Spark」、動き始めたエコシステム)。

 Sparkは、Hadoop MapReduceのようなバッチ処理、CEPのようなストリーミング処理、DWHのようなアドホック分析処理という、3タイプのビッグデータ処理に1つのソフト基盤で対応する特徴がある。

 電通大と日本ラッドは、前述したようなFPGAの利用形態だけでなく、今後、このSparkとFPGAを連携させていくことも検討しているという。具体的にSparkとFPGAをどう連携させるのかは未定とのことだが、なかなか今後の展開が楽しみである。