PR

 フェイルオーバー処理で失敗しないためには、「故障検知」と「処理の引き継ぎ」のそれぞれで確実性を高める必要がある(図1)。

図1●ユーザー企業における四つの自衛策
故障検知と処理引き継ぎの確実性を高めることで、自動フェイルオーバー失敗の可能性を減らすことができる
[画像のクリックで拡大表示]

 日本HPの挾間部長は故障検知の網を広げることを推奨する。「ERP(統合基幹業務システム)ならトランザクション、Webサーバーならレスポンスタイムなどサービスの品質を監視することで、ハードの異常も見抜きやすくなる」(挾間部長)という。

 日本HPは将来発生し得る故障を事前に発見するソフト「HP Service Health Analyzer(SHA)」を2012年3月から提供している。サービスの稼働状況やパフォーマンスなどを分単位で収集し、測定値間の相関関係や周期性を自動学習。学習情報を基に異常値を検知し、障害発生の予兆を事前に予測することが可能だ。SHAはフェイルオーバー機能も備える。

 ネットワーク機器は故障検知のレベルが装置により異なる。例えばポートのリンクの状態だけでなく、指定アドレスに定期的にpingを発行し応答を確認する製品もある。「要件定義の中で、故障検知の機能や仕組みを確かめるべきだ」と話すのはネットワンシステムズ第1製品技術部コアネットワークチームの中村喜之氏だ。

 処理引き継ぎの信頼性を上げるには、システム導入時の障害テストを手厚くしたい。「タイムアウト設定などの非機能要件についてもテストで確認しておくことが大切」と日本HPの挾間部長は語る。電源断やケーブル引き抜きによるフェイルオーバーの確認でテストを済ますケースもあるからだ。

 構成情報管理も徹底したい。冗長構成を組むサーバーは同じ設定でなければならない。ところがネットワーク構成の変化などで設定変更を繰り返すうちにサーバー間で差分が生じ、フェイルオーバーに失敗するケースも多いという。

 故障検知の失敗には、製品のバグに絡むものもある。定期的な改修版の適用が理想だが、適用にはシステムの一時停止が必要だ。提供するサービスや業務とバランスをとって判断したい。

この記事は会員登録で続きをご覧いただけます

日経クロステック登録会員になると…

新着が分かるメールマガジンが届く
キーワード登録、連載フォローが便利

さらに、有料会員に申し込むとすべての記事が読み放題に!
日経電子版セット今なら2カ月無料