7月末から8月上旬にかけて,インターネット・データセンターに相次いでトラブルが発生した。まず7月26日に,ベンチャー企業のオン・ザ・エッヂ(東京都渋谷区)のデータセンターで,顧客のWebサーバー上のコンテンツが消失するトラブルが起こった。原因は初歩的な人為ミス。オン・ザ・エッヂはすぐに復旧作業に着手し,2日後から順次,サービスを再開させた。

 8月2日には,ピーエスアイネット(PSINet,東京都品川区)のデータセンターで,顧客から預かったサーバーへのアクセスが不能になるトラブルが起こった。顧客が独自に作成したCGI(コモン・ゲートウエイ・インタフェース)プログラムの不正な動作が原因だった。PSINetがサービスを完全に復旧させるまで丸2日を要した。

 一連のトラブルは,他のデータセンター事業者にも共通する課題を改めて浮き彫りにした。すなわち,「人為的なミスの撲滅」と「運用における責任範囲の明確化」である。インターネット・データセンターの利用が拡大する中で,業界を挙げてこれらの課題に取り組むことが求められている。 (玉置 亮太)

 「正直に言って,作業に対する“慣れ”が災いしたのかもしれない」。インターネット・データセンター事業を手がけるベンチャー企業,オン・ザ・エッヂ(東京都渋谷区)の和井内修司取締役管理本部長は,今回のトラブルをこう振り返る。

 7月26日,同社が提供するハウジング/ホスティング・サービス「データホテル」でトラブルは起こった。データセンター内で稼働させているサーバーのうち,3台のWebサーバー上のコンテンツが消失し,3顧客が運営するオンライン掲示板などのサービスが停止してしまった。

表1●オン・ザ・エッヂのハウジング/ホスティング・サービス「データホテル」で発生したトラブルの経緯

作業対象のラックを取り違える

 トラブルの原因は,初歩的な人為ミスだった。データセンター内で新規サービスのセットアップ作業をする際に,作業指示責任者が対象ラックを取り違え,稼働中のサーバー機に対してOSのインストールなどのセットアップ作業を実施してしまったのだ。オン・ザ・エッヂがトラブルに気づいたのは,セットアップ作業開始から約7時間半後の7月26日午前10時ごろのことだった(表1[拡大表示])。

 バックアップしておいたデータも消えていた。同社はデータホテルのサーバー1台につきハードディスクを2基搭載して,24時間ごとにバックアップを取っている。しかし今回のトラブルでは,バックアップのデータも含め,ラックに搭載されたサーバーのディスクをすべて書き換えてしまった。

 事態を把握したオン・ザ・エッヂは,すぐさま復旧作業に着手した。7月26日午後3時ごろには,トラブルが発生したサーバー3台のOSとサーバー・ソフトの再インストールを完了。その後,各顧客の元にあった掲示板用のWebページを再アップロードするなど,サービス復旧にとりかかった。

 幸い,トラブルが発生した顧客のサーバーは,「カスタマイズした部分が比較的少なかったので,復旧作業自体は容易だった」(和井内取締役)。掲示板の過去の書き込みなどは消えてしまったものの,翌々日の7月28日には,3台のうち2台のWebサーバーのサービスが完全復旧。3台目のサーバーは,8月3日にサービスを再開した。3台目のサーバーについては,「顧客がこの機会にWebサイトの内容を刷新したいと希望した。このため,復旧作業とデザインの変更作業などを並行して実施したので,他の2台に比べサービス再開に時間がかかった」(同)。

 オン・ザ・エッヂは,社内のミスによってサービスが停止したことを,トラブル発生の翌日(7月27日)にホームページ上で公表した。「トラブルの情報でも積極的に公開したほうが,最終的には信頼を得ることができると判断した」(和井内取締役)。