PR

 耐障害性。サーバー・システムの一部に障害が発生しても、全体を停止させずに処理を続けるようにする仕組みのこと。その間に故障部分を修復できる。耐障害性を高めるには、ハード的な対策とソフト的な対策がある。ハードでの対策が、フォールト・トレラント・サーバー(FTサーバー)と呼ぶ耐障害性を高めたハードウエアを使う方法。ソフトでの対策が、複数台のサーバーを組み合わせて、OSやソフトの障害に対する冗長性を高めるソフトを利用してクラスタリング・システムを構築する方法である。FTサーバーを使うと障害時の切り替えが速い半面、ソフト障害には対応できない。

 FTサーバーは、ハードが故障してもシステムを停止させない仕組みを備えている。複数のプロセサを搭載する、ハードディスクをRAID(安価なディスクを組み合わせたディスク装置)化する、LANインタフェースや電源、冷却ファンを2重化するといったものだ。複数搭載したプロセサやメモリーが常に同期をとりながら処理をしているため、どれか一つの部品に障害が起きても、他のプロセサやメモリーが瞬時に処理を引き継ぐことができる。

 システムを止めずに故障個所を修復するための仕組みも持つ。ハードディスクやメモリーのエラーを検出し、修正する仕組みである。パリティ・チェック付きのRAID5ディスク装置や誤り訂正機能付きのECCメモリーなどがそれに当たる。機器が稼働している状態でも部品を交換できるホット・スワップ(活線挿抜)も修復向け機能の一つである。

 FTサーバーには従来型と新型がある。従来は、米ヒューレット・パッカードの「NonStop Server」のように独自のOSやハードで構成していた。最近は米ストラタステクノロジーの「ftServer」などインテルのプロセサやWindowsOSを使った安価なパソコンFTサーバーが増えてきた。

 一方、クラスタリング・システムは、通常同じ仕様のサーバーを複数台用意し、稼働系サーバーに障害が発生した場合に、待機系サーバーに処理を引き継ぐ。この処理はそれぞれのサーバーに搭載したクラスタ・ソフトが自動的に行う。

 サーバー障害が起きた場合でも、システム管理者は待機系サーバーで業務を続けながら障害の原因を究明することが可能だ。正常時に、稼働系と待機系が同じ処理を実施しながら、障害に備える構成をホット・スタンバイと呼ぶ。これに対して、稼働系がダウンしてから待機系を起動する構成をコールド・スタンバイと呼ぶ。コールド・スタンバイのほうが起動時間の分、障害時に処理を引き継ぐまでに時間がかかる。

 クラスタリングは待機系に切り替える基準に注意する必要がある。クラスタ・ソフトの設定を自社の要件にあったものに調整しなければ、いざという時に切り替わらない、もしくは必要もないのに切り替わるといったことが起きてしまう。

(鈴木)

本記事は日経コンピュータ2004年11月15日号に掲載したものです。
同誌ホームページには,主要記事の概要や最新号およびバックナンバーの目次などを掲載しておりますので,どうぞご利用ください。

日経コンピュータ・ホームページ

定期購読お申し込みや当該号のご購入