PR

「止まったら即復旧」を合言葉に安定化プロジェクトに取り組んできたITサービス企画室の斎藤嘉彦マネジャー(左)と西畑智博マネジャー(右)
[画像のクリックで拡大表示]

 日本航空が2年前から取り組んでいるシステム安定稼働プロジェクトの成果が見え始めた。2005年度に123件あったシステム停止が、2006年度は12月時点(4月~12月の9カ月)で44件。前年4月~12月が99件なので、半分以下に減ったわけだ。

 システムの安定稼働に寄与したのが、2005年から取り組んできたITIL(ITインフラストラクチャー・ライブラリー)の導入と、2006年4月に日本IBMと締結したペナルティー(罰則金)付きのSLA(サービスレベル契約)である。今年度中には取引のある主要ベンダーと契約を締結する見込みである。

 日本IBMの契約で対象となるのは安全運航や予約、発券など業務に大きな影響を及ぼす30のシステム。契約内容は、サービス停止から復旧までの時間と障害の発生回数に応じて罰則金を受け取る形式。罰則金が発生するケースは2種類ある。1つは、復旧時間がSLAで規定した時間を上回った場合。もう1つは複雑で、復旧時間と発生回数の両方を組み合わせたものだ。

 後者の仕組みは、次のようになっている。日本航空では、SLAを導入するにあたって、業務の現場にシステム停止が許容できる時間(「期待時間」と呼ぶ)をヒアリングした。SLAの規定時間を下回った場合でも、期待時間を上回る障害件数が規定値を超えると罰則金が発生する仕組みだ。

 例えば、SLAで規定した時間が30分、現場が望む期待時間が10分であれば、復旧時間が30分を超える障害が発生するか、あるいは復旧時間が10分超30分未満の障害があらかじめ決めた回数以上発生すれば、罰則金が発生する。金額については「社内決裁が必要なインパクトのある額」(ITサービス企画室の西畑智博マネジャー)だという。

 罰則金は年次で受け取る仕組みだが、ある月で発生しても年間を通してサービスレベルが高品質だった場合には、実際には徴収しない制度も盛り込んだ。年間のサービス停止時間の総和を12で割った数字、すなわち月間の平均サービス停止時間が、1回当たりの期待時間以下だった場合には、罰則金は発生しない。先の例では、月間の平均サービス停止時間が10分以下であれば、罰則金は発生しない。このような仕組みを盛り込んだのは、「システムの安定稼働が目的で、コスト削減ではない」(西畑マネジャー)からだ。

 契約に至るまでの道のりは長かった。日本航空から日本IBMに提案した際、当初は難色を示された。その後、海外の航空会社で導入している企業があることを知った西畑マネジャーがは、マレーシア航空やシンガポール航空などの航空会社に出向いた。そこで、他国のIBM現地法人で、ペナルティー付きのSLAサービスを提供していることが分かった。これらを材料にしながら「欲しいのは罰則金ではなく安定稼働」(西畑マネジャー)だと粘り強く交渉し、契約締結にこぎついた。

ITILでシステム復旧作業を標準化

 プロジェクトで取り組んできたもう一つの取り組みがITILの導入だ。システム停止を未然に防いだり、停止した場合に素早く復旧できるように運用作業手順を定義してきた。

 同社では、ハードウエアやソフトウエアの更新などが年間1万2000回も発生する。作業手順を標準化することで、例えば1つのサーバーにはパッチをあてたものの、ほかのサーバーで対応できていないといったミスを防ぐ。システム変更に4段階のレベルを設定し、承認手続きなどのプロセスを明文化した。「システム間の横串を通して対応できるようになった」(ITサービス企画室の斎藤嘉彦マネジャー)という。

 システム障害が発生した場合の手順も定義した。まず障害が発生してから15分以内に、CIO(最高情報責任者)である執行役員の齋藤俊一ITサービス企画室長をはじめとする社内関係者に加え、日本IBMなどベンダーの関係者の携帯電話に電子メールで状況を報告するといった具合である。「きちんと初動を確保することで、いち早く復旧することを目指す」(斎藤マネジャー)という。