PR

 楽天モバイルは2020年1月17日、自営回線で2019年12月10日に生じた通信障害の原因を公表した。課金を制御する機器が内蔵するデータベース管理システム(DBMS)において、複数の処理が互いの終了を待ち合う、いわゆるデッドロックが発生して機能が停止した。同社は同日付で、再発防止策などを含む報告書を総務省に提出した。

楽天モバイルは2019年12月に発生した通信障害の原因を公表した
楽天モバイルは2019年12月に発生した通信障害の原因を公表した
(出所:楽天モバイル)
[画像のクリックで拡大表示]

 システム障害は12月10日午前8時34分から午前11時15分まで約2時間半続いた。この間、約1000回線のデータ通信と147回線の音声通話が利用できないかつながりにくい状況となった。同社の自営回線は現在「無料サポータープログラム」として5000人限定で試験サービスを展開している。

 原因となったDBMSはフィンランド・ノキア(Nokia)製の課金制御機器に内蔵されていた。同機器は同社の西日本セントラルデータセンター内にあった。

 課金制御機器は音声通話やデータ通信について、通信単価といった情報を設定する専用機器である。同機器が内蔵するDBMSに潜在的なバグがあり、何らかの理由でロック処理が遅延。別の処理との間でデッドロック状態になったとみられる。楽天モバイルはどう対処して復旧させたかについては明らかにしていない。

 再発防止策として、ノキアを通じてDBMSのアルゴリズムを改修し、「ロック処理が遅延してもデッドロックを発生させない対処を実施した」(楽天モバイル)という。併せて、今回問題となった課金制御機器以外の全ての通信機器についても、納入元の全ベンダーにデッドロックが発生する可能性がないか検証を依頼した。

 加えて2020年4月の本格サービス開始までに向けて過負荷試験を追加実施し、監視態勢の強化、利用者への周知の改善などにも取り組むとしている。楽天モバイルの自営回線はインフラにネットワーク仮想化技術を全面導入しているが、今回の障害とは関係がなく、システム障害時は過負荷状態でもなかったという。