効率的にデータ容量を減らす「重複排除」技術を採用する企業が増えている。複数のファイルやブロックから重複した部分だけ取り除くため、内容を損なわず大量のデータを保存できる。加えて、人手がかかっていたテープの管理や搬送が不要になる。

 情報システムのアウトソーシングなどを手掛けるビック東海は2009年5月、データの「重複排除」機能を活用した新サービスを開始した。内容は、遠隔地にある企業のデータを回線経由でビック東海のデータセンターに送り、バックアップするというもの。

 「BroadCenter リモートバックアップサービス」というこのサービスは、企業データを1日単位で基本的に7日分保持する。容量が200Gバイトまでの基本プランで、初期費用が10万円、月額料金が9万円(12カ月契約の場合)である。サービス開始前にもかかわらず、すでに数社の採用が決まっており、そのほかにも多くの引き合いがあるという。

 同社は以前にも、こうしたサービスを企画したことがあった。だが、実際にはサービス提供を見送った。同社の太田雅雄データセンタ・ソリューション事業部企画開発部部長は「検討した5年前の時点でネックになったのは、バックアップデータを転送する回線速度だ」と振り返る。遠隔地から大量のデータを転送するには、高速かつ高価な回線が必要で、それではコストがかかり過ぎたためだ。

 だが今回、回線の速度を上げることなく“大量データの転送”を実現した。EMCジャパンの重複排除ソフト「Avamar」を採用し、データ容量を削減したうえでデータセンターに転送するようにした(図1)。

図1●ビック東海は遠隔データ保管サービスに重複排除を活用
図1●ビック東海は遠隔データ保管サービスに重複排除を活用
[画像のクリックで拡大表示]

 重複排除は、複数のファイルやブロックに重複したデータがある場合、一つだけを残してほかを排除する技術だ。ビック東海のケースを例に説明する。

 A社のサーバーにa、bのブロックから成るファイルXと、b、cのブロックから成るファイルYがあるとする。ストレージにはすでにブロックcが保存してある。ファイルX、Yをバックアップする場合、AvamarはXとYに共通するbを一つ削除する。さらに、ストレージにあるcを転送対象から除く。これらにより、aとbだけが送られる。

 重複排除によるデータ削減効果について、製品を提供するファルコンストア・ジャパンの大塚健一郎マーケティングマネージャーは「重複排除でデータ容量は元の20分の1程度になる」と説明する。