PR

 2006年1月18日、東京証券取引所が全銘柄の株式売買を停止させた。いわゆる“ライブドアショック”から個人投資家などの売り注文が殺到したことで、システム処理能力の限界を超える恐れが出てきたためだ。もしシステムを止めず、取引処理を続行していたら、それ以上の広範囲な分野に影響を及ぼした可能性も考えられるからだろう。

 多くの企業でも同様に、こうしたシステムを止めざるを得ない事態に追い込まれることはあり得る。ところが、システムの異常を予見しても、そのまま放置すれば大規模な障害に発展するかもと思いながらも、つい「このまま乗り切れるかも」と考えてしまう。社内ユーザーに加えて、取引先などに多大な影響を与えることを懸念するためだ。東証のように社内外から批判を浴びることもシステム停止を躊躇させるのだろう。

 だが、そもそも完璧なシステムなどあるのだろうか。誤謬もあるだろう。公共機関などには止められないシステムもあるが、多くの企業は莫大なコストをかけてまで止まらないシステムを構築する必要があるだろうか。もちろん安易に止めることはできないので、拡張性のある柔軟なシステムに作りかえるなど、障害に発展する芽を摘んでおくことは当然である。それでも想定外の誤動作などから「危ないなあ」と予感したら、止めることの決断に迫られることもある。そう考えておくべきではないだろうか。

 あるITサービス会社の経営者によると、何でもかんでも機能を盛り込んでしまい、システムが際限なく肥大しているという。特殊なケースまでシステムに組み込んだ結果、コストは高くなるし、システム全体の品質低下を招くこともある。年1回しか処理しないことをシステムに盛り込んだことを忘れてしまうことだってあるだろう。そこに問題が発生すれば、ユーザーは「品質が悪い」と批判するが、もしかしたら過剰品質を要求しているかもしれない。システムの問題だけではないのだ。

 しかもITサービス会社が「テストが完了した。大丈夫です」と言っても、ユーザー企業はそれを確認する術がないし、何が起きるか予想もできないだろう。まず品質管理の方法が分かりにくいし、多くのITサービス会社が参加するプロジェクトになれば、その方法は各社各様だからでもある。さらにネットで他社システムと接続していれば、なおさら複雑になる。ネットが切れても理由を説明できないことだってある。場合によっては、外部との接続を切る。

障害は必ず発生する

 問題の原因究明に時間もかかる。異常が発生した場合、運用部門は業務部門などにその内容を伝え、業務部門などがその後の処理を中断するのか、異常データを外して処理を続行させるなどを決める。例えばデータベースに正しく書き込まれていない時やレスポンスが極端に低下した時など、どんな状況になったら止めるのかを予め決めておくことだ。もちろん誰が決断するを含めて、止める判断基準を明確し、かつ監視体制を整備するのは必要だ。

 また、運用部門は原因究明に1時間かかるのか、5時間かかるのか明確に答えられないと、決断はずるずると延びてしまうことになりかねない。運用部門は正しく伝えることが肝要だ。場合によっては、業務プロセスの見直しに発展することもあるだろう。その企業を取り巻く環境が変われば、業務プロセスを見直すこともあるだろうし、特殊な処理を外すことを求められることもあるだろう。

 100%システム化することは改めるべきだし、混乱を招く恐れもある。「この部分は人が処理したほうがいい」といった見直しもあるかもしれない。そして、問題があれば、リリースを延期するとか、止めるという選択をしなければならなくなるかもしれない。それが顧客サービスの向上にもなる。例えばECサイトなら、「異常なデータが来たので止めることにしました」といった告知をする。そして、その対策も告げる。

 止めないことが罪悪なのだろうか。止めないことが一番素晴らしいことなのだろうか。障害は必ず発生する。その時にどう対応するのか。これこそIT部門が考え、経営者が決断すべき部分である。人間系を無視してはいけないということを、改めて考えるチャンスである。

この連載の他の回を読む

注)本記事は日経コンピュータ06年2月6日号「ITアスペクト」に加筆したものです。