全7599文字
PR

 近年、ITシステムの大規模障害によって企業が経営責任を問われるケースが増えている。システム障害が大きな話題となるのは、かつて業務効率化のためのツールだったITが、今や企業のビジネスそのものとなったためだ。分散化の傾向が強まり、複雑さを増す最近のシステム障害対策は以前より難しくなっている。システムの堅固さを追求するだけでなく、いずれ障害が起こる前提で回復性(レジリエンシー)をも重視した設計・運用が重要だ。そこでこの特集では回復性の視点から、システム障害対応のポイントを解説する。

 今回はシステム障害時の意思決定プロセスや体制、判断基準を事前にまとめる際のポイントを見ていこう。この特集の前回の記事で述べたように、システム障害時は情報過多あるいは過少、時間的制約の厳しさなどから担当者に大きなプレッシャーがかかる。その結果、適切な意思決定ができず、かえって復旧までの時間が長引くことがある。前もって「IT-BCP(情報システムに関する事業継続計画)」の計画書作成や訓練を実施しておくことで、適正な意思決定と迅速なシステム復旧が可能になる。

関連記事 システム障害の大敵、適切な意思決定を阻む8つの「心理的バイアス」と回避策

 BCPはBusiness Continuity Planの略で、自然災害など予期せぬ事態が発生したときでも、ビジネスを継続可能にする行動計画のこと。IT-BCPは情報システムやサービスを維持する観点からまとめた事業継続計画だ。一般的なBCPでは大規模災害などを想定して被害の影響を分析する。その方法を踏襲して、IT-BCPではシステム障害への対応手順、体制、連絡手段などをまとめる。

 一般的にIT-BCPに記載すべき項目は以下の通り。

  • 基本方針:IT-BCPの目的、適用範囲と優先的に対策に取り組むべきシステムなどを定める
  • 緊急時の体制と連絡方法:被害発生時、ITーBCPを発動した際の体制として、責任者、代行責任者、作業実施責任者、作業実施担当者、関係者との連絡担当者、委託先の担当者などを定める。また各担当者の役割分担とその連絡手法を定める
  • 被災事象と被害シナリオ:自然災害、情報漏洩(ろうえい)、サイバーテロなど事業や組織に起こると想定される被災事象を抽出。さらに、被害シナリオとしてシステムの具体的な被害状況を設定する
  • システム復旧の優先順位:優先的に復旧が必要な事業や業務を定める。また、業務復旧に必要なシステムについてRTO(Recovery Time Objectiveの略。目標復旧時間)、RPO(Recovery Point Objectiveの略。目標復旧時点)、RLO(Recovery Level Objectiveの略。目標復旧レベル)を設定する
  • 個別システムの復旧手順:個別システムの復旧に必要となる復旧手順を被害シナリオに合わせて記載する。ネットワーク復旧手順、災害対策システムの稼働や、バックアップデータの戻し方などの手順を策定する
  • システム事前対策:緊急時に備える事前対策として、建物・電力・空調・ネットワークの対策を検討し、災害対策システムを整備。システム冗長化、バックアップデータの取得、外部サービス利用などの実施方法を定める。緊急時にはハードウエアやソフトウエアの再調達が困難になる可能性も考慮して対策を記載する
  • 教育・訓練:システム担当者の習熟度を向上させ、システム復旧手順や事前対策などの有効性を確認するために教育・訓練の実施方法を定める
  • 見直し・改善:自社の業務内容や外部環境の変化、システムの利活用状況の変化に応じて、被害シナリオ、復旧手順、訓練などの見直し・改善を実施する時期と体制を定める

 なおIT-BCPやコンティンジェンシープラン(緊急時対応計画)については、省庁や標準化団体によってさまざまなガイドラインや規格が定められている。自社の計画を策定する際は、以下のようなガイドラインを参考にするとよいだろう。

  • 「ITサービス継続ガイドライン 改訂版」経済産業省(2012年)
  • 「政府機関等における情報システム運用継続計画ガイドライン(第3版)」内閣サイバーセキュリティセンター(2021年)
  • 「金融機関等におけるコンティンジェンシープラン策定のための手引書(第3版追補3)」金融情報システムセンター(2017年)
  • 「高回復力システム基盤導入ガイド(概要編、計画編)」情報処理推進機構(2018年)
  • 「ISO/IEC 27031:2011」(Guidelines for information and communication technology readiness for business continuity)国際標準化機構/国際電気標準会議(2011年)

「機能しないIT-BCPあるある」5つと改善ポイント

 IT-BCPを作ったはいいが、実際にシステム障害が発生した際に有効に機能しないケースもある。IT-BCPの内容が、現実のシステム復旧の手順にそぐわないことがあるのだ。多くの企業で陥りがちな問題として、以下の5点が挙げられる。

【1】情報システム部門(IT部門)に閉じたIT-BCPになっている
【2】想定している被害シナリオが限定的である
【3】大規模障害発生時の外部情報発信が遅れる
【4】計画変更のルールがなく陳腐化している
【5】定期的な訓練がないため対策の形骸化、担当者のマインド低下を招く

 実際に障害対応の現場で機能するIT-BCPを作るにはどうすればいいか、課題とその対策を見ていこう。