全2833文字
PR

 みずほ銀行で2021年2~3月にかけて発生したシステム障害。みずほフィナンシャルグループ(FG)が2021年6月15日に公開した第三者委員会による調査報告書は「運用する人為的側面に障害発生の要因があった」とする。データベースの監視項目を見落とすなど深刻な運用の不備があった。

 みずほ銀行では2021年2月28日、3月3日、3月7日、3月12日にそれぞれ異なる事象のシステム障害が発生した。この中でも2月28日に起きた障害は、顧客への影響が大きく、障害の原因も複雑だった。一方、3月3日と3月12日はハードウエア障害が、3月7日はプログラムの設計ミスが原因であり、影響も限定的だった。そのため第三者委員会である「システム障害特別調査委員会」の調査報告書でも、2月28日の障害について手厚く記述している。

みずほ銀行で2021年2~3月に発生したシステム障害
発生日時主な影響原因
2021年2月28日ピーク時は自行ATMの7割超に相当する4318台が一時停止。ATMが通帳やキャッシュカードを取り込むトラブルが5244件発生定期性預金システムにある「取消情報管理テーブル」のインデックスファイルのメモリー容量超過リスクの認識不足
3月3日ATMが通帳やキャッシュカードを取り込むトラブルが29件発生。ATMやみずほダイレクト経由のナンバーズ(宝くじ)の購入取引が一部不成立みずほ銀行のデータセンターにあるネットワーク機器のネットワークカードが故障。他系統に切り替わるまで通信が不安定に
3月7日ATMやみずほダイレクトにおいて定期入金取引の一部が不成立。ATMで定期預金の一部サービスを停止カードローン商品の延滞利息徴求機能に関するプログラムの設計ミス
3月12日国内他行向け仕向送金263件が当日中の期限に間に合わず。外為被仕向送金の入金案内処理761件が当日中に完了できずみずほ銀行が日立製作所からサービス提供を受けているストレージ装置内の通信制御装置の故障。復旧手順の準備不足なども露呈

 2月28日のシステム障害では、ピーク時は自行ATMの7割超に相当する4318台が稼働を一時停止した。これに伴い、ATMが通帳やキャッシュカードを取り込むトラブルが合計5244件起きた。ATMやインターネットバンキング「みずほダイレクト」の一部取引もできなくなった。

 報告書は2月28日の障害について「MINORIの構造、仕組み自体に欠陥があったのではなく、これを運用する人為的側面に障害発生の要因があった」とする。運用にどのような問題があったのか。詳しく見ていこう。

インデックスファイルがメモリー容量を超過

 報告書によると、2月28日のシステム障害の発端は勘定系システム「MINORI」の一部である「定期性預金システム」のデータベース(DB)でトラブルが続発したことにあった。1年以上記帳がない定期預金の口座約45万件を、通帳を発行しない「みずほe-口座」へ一括して切り替える処理の作業中に、DBに存在する「取消情報管理テーブル」のインデックスファイルのサイズが、確保していたメモリー容量を超過した。その結果、DBの更新処理ができなくなった。

 定期性預金システムのDBで更新処理エラーが続発したことをきっかけに、MINORIの司令塔に当たる「取引メイン」と呼ばれるシステムで、さらなる不具合が発生した。取引メインは定期性預金システムで起きたDB更新処理エラーに対応するため、その更新を自動的に取り消そうとした。しかし取り消し処理に必要な情報が定期性預金システムのDBに残っていなかったため、取り消し処理自体がエラーになる「二重エラー」が発生した。

 MINORIは取引メインで二重エラーが相次ぎ発生すると、システムの全面停止を防止する措置を自動的に開始する。具体的には、勘定系システムに対するトランザクションの入り口にあたるATM処理システムや、みずほダイレクトの処理システムが稼働するメインフレームのパーティション(区画)をシャットダウン(閉塞)することで、トランザクションを抑制しようとした。ATM処理システムのパーティションが次々とシャットダウンしていった結果、ATMにおける通帳やキャッシュカードの取り込みが発生した。

 2月28日のシステム障害の原因は突き詰めると、定期性預金システムのDBにおいてインデックスファイルのメモリー容量超過にあった。「一見初歩的なミス」(報告書)だが、その背景にはシステム運用における大きな問題があった。