全4675文字
PR

 大規模通信障害の発生を受けてKDDIは2022年7月28日にも総務省へ報告書を提出する。報告書の焦点は、実効性の高い再発防止策を打ち出せるかどうかだ。一連のシステム障害を起こしたみずほ銀行も再発防止策を策定し、取り組みを進めている。緊急座談会の後編では、みずほ銀行の教訓から学ぶKDDIの再発防止策のポイントを探る。(司会は堀越 功=日経クロステック)

KDDIの通信障害が大規模化、長期化した理由として、昔と比べてモバイルネットワークが複雑になっている点が指摘されています。

日経クロステック高槻 芳: KDDIの通信障害は、制御信号と呼ばれる電話システム特有のトラフィックが、加入者データベース(DB)に集中したことが原因の一つです。モバイルネットワークでは、同期コミュニケーションである音声通話を必ずつながるようにするために、実際の音声データだけでなくさまざまな制御信号がやりとりされます。

 現在のモバイルネットワークは、IP網上でこのような音声通話の仕組みを再現している状態です。Webシステムなどと比べて、非常に複雑なトランザクション処理が必要になる点が違います。わずかなボタンの掛け違いで、雪だるまのように制御信号が増えてしまい、アクセスが集中する「輻輳(ふくそう)」状態に陥ります。

 金融システムもトランザクション処理があります。しかしモバイルネットワークの場合、数百万、数千万という規模で制御信号がやりとりされます。ここは少し特殊な部分だと思います。

みずほ銀行のシステム障害も、DBに起因するトランザクションのエラーが原因の1つでした。

日経クロステック中田 敦:みずほ銀行の2021年2月28日のシステム障害は、DB周辺のトラブルが原因でした。定期預金システムで使っていたDBが、大量のトランザクションを処理できる設定になっていませんでした。

 定期預金システムのDBが処理できなくなったことで、その影響がメインフレームで稼働しているDBに波及し、エラーが起きました。エラーを抑えるために、メインフレームのDBへのトランザクションを絞る機構が働き、その影響でATMからのトランザクション処理が失敗して、ATMが通帳やカードを飲み込んだという流れになります。

 みずほ銀行の定期預金システムのDBは富士通製で、メインフレームのDBは日本IBM製でした。そのため定期預金システムを見ている担当者は、メインフレームにエラーが波及している状況を把握していませんでした。連鎖障害の影響を見極められなかった点が、システム障害を長引かせた大きな原因になっています。

 なお今回のKDDI通信障害では、「DBが輻輳」という表現が普通に使われている点に、違和感があります。情報システムの場合、「トランザクションがどれくらい失敗したのか」「レスポンスタイムがどれくらい遅くなったのか」「同時接続数をどれくらい減らしたのか」といった言葉で説明します。「DBが輻輳」では、何も語っていないのと同じです。

KDDIの通信障害は、利用者への周知が十分ではなかったという指摘があります。

日経クロステック金子 寛人: KDDIが通信障害発生後、最初に会見した際の高橋誠社長の対応について、ネットでは「社長なのにきちんと説明できている」という称賛の声があがりました。これはKDDIの実務担当者が障害の初動段階で、一般の利用者に対してどのような問題が起きているのか、きちんと説明できていなかったことの裏返しではないでしょうか。

 通信障害を起こしたKDDIは、総務省から「もっと顧客目線で情報開示すべきだ」という指摘を受けました。KDDIはその後、1時間ごとに情報を開示するように改めました。

 顧客目線で情報開示するという方向性は間違っていません。ただし1時間ごとに情報を小出しにするだけでは、利用者の不安はいつまでたっても消えません。もっと利用者の不安を解消するような情報開示の仕方があったのではないでしょうか。

 例えば「Wi-Fiのような代替手段があります」とか「Wi-Fiに接続すれば、対話アプリを使って音声通話ができます」など、利用者の目線に立った情報開示の方法はいろいろあったと思います。