全日本空輸(ANA)は2023年4月4日、4月3日午後に発生した旅客系基幹システム「able-D」の障害について記者会見を開いた。この中で同社は、障害の発端はable-Dに連なるデータベースが2系統同時にダウンしたことだと明らかにした。同社ではソフトウエアに何らかの原因があるとみて、引き続き原因の特定を進めている。
続報(2023年4月7日) ANAシステム障害の原因判明、DB並列参照時にパッチ未適用の既知バグでフリーズANAではable-Dについて、障害対策の観点で同一構成の「A系」「B系」の2系統を用意しており、本番系と待機系を定期的に入れ替えている。またA系、B系のそれぞれについて、「DB1」「DB2」という2系統のデータベースを接続しており、DB1とDB2は常にデータが同期されている。
今回のシステム障害が発生した4月3日の午後2時16分ごろ、本番運用中だったA系の基幹システムに連なるデータベースがDB1、DB2の両系統とも突然ダウンした。データベースの再起動を試みたが立ち上がらなかった。そのため午後3時11分にB系へ切り替え、乗客への情報配信システムなど一部を除き運用を再開した。翌4月4日午前には、発端となったA系のデータベース2系統も復旧。B系のデータベースからデータを複製したことで復旧に至ったという。
システム障害の原因について同社の加藤恭子執行役員デジタル変革室長は「障害原因の切り分けの結果、ハードウエアの障害やサイバー攻撃ではないと確認が取れており、ソフトウエアの障害だと思っている。4月1日に(国内線の旧搭乗手続きサービスである)SKiPサービスの終了に伴う改修を実施したが、これも無関係と判明している」と説明。そのうえで「データベースに対して当社の他のシステムが書き込み処理を行っている。(障害の発生前後に)どんなソフトウエアを使って書き込みをしていたか絞り込みをしているところだ」(加藤執行役員)と明らかにした。
障害の原因を特定・改修するまでの当面の再発防止策として、「(今回と同様にデータベースの障害で)本番系が停止した際は、速やかに待機系へ切り替えるよう復旧手順を見直した。切り替え自体は15分程度で実行できる」(加藤執行役員)とした。
関連記事 ANA国内線でシステム障害、予約・発券や搭乗手続きが約1時間不能に
















































