全1708文字
PR

2019年7月15日についに完了したみずほ銀行のシステム統合。20年にも及ぶその苦闘を「日経コンピュータ」の記事で振り返る。2002年5月6日号は、2002年4月1日から発生した大規模システム障害の原因を報道した。テストを完了させぬまま勘定系の稼働を強行したことが大規模障害を招いた。

 みずほ銀行で4月1日から表面化した一連の情報システム障害の直接原因が明らかになった。ATM(現金自動預け払い機)が正常に稼働しなくなった原因は、旧第一勧業銀行の対外接続系システム(富士通のメインフレームを利用)の修整ミス。これまで報道されてきた、「リレー・コンピュータ(RC)」(富士通のUNIXサーバーを利用)の不具合ではなかった。

 口座振替のトラブルの原因は、口座振替処理(センターカット)のために新規導入したプログラム(日立製作所のメインフレーム上で稼働)の開発に失敗したことだ。対外接続系とセンターカット用プログラムの修整・開発作業は、第一勧銀情報システム(DKIS)が中心になり、ソフト会社の協力を得て進めたものである。

 みずほ銀行はシステム統合にあたって、旧第一勧銀の対外接続系システムに、旧富士銀行の勘定系をRCを介して接続した。旧第一勧銀の勘定系は対外接続系を経由して、BANCS(都市銀行間のATM提携ネットワーク)、全銀システム、自社のATMなどとつながっており、ここにRCが追加されたわけだ。

対外接続系のCOBOLプログラムにバグ

 今回問題が起こったのは、対外接続系の中でRCと処理をやり取りするプログラムである。RCを接続するために、既存の対外接続系のCOBOLプログラムを追加したり、プログラムを追加したが、論理的な接続経路を維持するためのプログラムの記述に誤りがあった。旧第一勧銀と旧富士銀の勘定系の間を行き来するデータの変換はRC上で実施しており、RC自体は問題なく稼働していた。

 対外接続系のバグは「RC通信中の電文を保存する領域に一定以上の電文がたまる」、「異なる電文をある組み合わせで処理する」といった条件が重なった場合に限って表面化するものだった。そのため、事前に実施した疎通テストや負荷テストでは検出できなかった。

 4月1日午前8時のオンライン利用開始直後に、バグが表面化した。みずほ銀行は対外接続系システムとRCとの接続をいったん切断して、原因の究明に当たったが、障害部分の特定に手間取った。原因が分かったのは午後1時ごろだった。