PR

ストレージ側でデータパスを管理

 この構成で従来のボトルネックを解消できるのは、従来型のシステムでCPUやネットワークスイッチが行っている複雑なデータパスの管理が不要になるからである。データにアクセスする際、CPUは単一のメモリー空間上のアドレスを指定するだけで済む。データがどのノードモジュール上にあるか、どのネットワークパスを経由してアクセスすべきなのかは意識する必要がない。

 CPUが発したコマンドやデータはパケット化されて、ノードコントローラーが持つパケットのルーティング機能により、2次元ネットワーク上の所望のノードモジュールとの間でやり取りされる。この際、最適なデータパス(最も短いレイテンシーで通信できる経路)は常に2次元ネットワーク上の最短経路となる(故障ノードなどがない場合)。

 これに対し、従来型のネットワーク接続を前提としたシステムでは、CPUがアクセスしたいデータのメモリー空間上のアドレスが分かっていても、そのアドレスを有しているノードのネットワークアドレス(IPアドレス)が分からなければアクセスできない。しかも、従来のツリー構造のネットワークでは、そのノードへの最適なデータパスをあらかじめ知ることは極めて困難である。ネットワークが均質ではないため、アクセスパターンやネットワーク構成によって最適なデータパスが変化するからだ。

 従来方式のボトルネックは、一言で言えばデータアクセスの複雑さにある。そしてこの複雑さは、もともと均質なメモリー空間上のアドレスを、不均質なツリーネットワークとIPアドレス空間にマッピングしたことに起因している。既存システムはデータの処理や格納方法などの工夫で回避を図っているが、処理の内容やデータの性質の予測が難しいビッグデータ処理では、ボトルネックが顕在化することが少なくない。我々は、均質なネットワーク構成によってデータアクセスを容易化することで、この問題を根本的に解消できると考えている。