PR

先にメモリーに移った競合

 国立情報学研究所アーキテクチャ科学研究系の佐藤一郎教授は、チャンクを1Mバイトにすることが、「データ保存にハードディスクではなくSSD(半導体ディスク)を採用する布石ではないか」とみる。チャンクのサイズを小さくすると、ファイルの読み書き操作が増加する。それによる性能低下を避けるためには、ハードディスクよりも遅延の少ないSSDを使用するのが合理的だ。SSDの価格が急激に低下している現在、価格/性能比的にも問題がなく、サーバーの消費電力も削減できる。

 現時点でグーグルは、データ保存をSSDに移行するとは明言していない。しかし、グーグルコンピューティングに極めてよく似たコンピューティングの開発を始めた競合他社は、データ保存の場をハードディスクからメモリーに移しつつある。

 その競合とは、米アマゾン・ドット・コムと米マイクロソフトである。クラウドコンピューティングの動向に詳しい早稲田大学大学院客員教授の丸山不二夫氏は、アマゾンやマイクロソフトの分散処理ソフトウエアが、グーグルの影響を色濃く受けていると指摘する。そして、ソフトウエアの開発時期や採用する技術の新規性に基づいて、グーグルの GFSやMapReduce、BigTableなどを「クラウドコンピューティング技術の第一世代」、アマゾンのキー・バリュー型データストア「Amazon Dynamo」を「第二世代」、マイクロソフトのクラウドコンピューティング基盤技術「Windows Azure」を「第三世代」と位置づける(図8)。

図8●クラウド時代の分散処理技術の世代
早稲田大学大学院客員教授の丸山不二夫氏は、クラウドコンピューティング時代の分散処理技術を、開発時期や、より先端的な技術の利用度合いによって、三つの世代に分類している。最初に開発され、実用化されたグーグルの技術は、今となってはアマゾンやマイクロソフトと比較すると最先端とは言い難いが、グーグルも次世代GFSの開発を進めている
[画像のクリックで拡大表示]

 次期GFSが実装するマルチマスター構成は、Amazon DynamoやWindows Azureのキー・バリュー型データストア「Azure Storage」が採用済み。Amazon Dynamoはコンシステントハッシングというマルチマスター構成を採用し、Azure Storageはピア・ツー・ピア技術の基盤である「分散ハッシュテーブル」というマルチマスター構成を採用する。

 Amazon DynamoやAzure Storageは、データの主たる保存先をサーバーの物理メモリーとすることで、システムの応答性を向上するというアプローチを採用している。これまで、「データの永続化」とはハードディスクにデータを保存することを指していた。しかし十分な数の複製を複数のサーバーに作成すれば、保存先がメモリーでもデータの永続化が図れるというのが、Amazon DynamoやAzure Storageの発想だ。

 グーグルコンピューティングは、アマゾンやマイクロソフトといった競合に多大な影響を与えた。そして今グーグル自身も、アマゾンやマイクロソフトに対抗すべく、自身のコンピューティングを今後も劇的に変化させるただ中にいる。