全2142文字
PR

 今やネットワークは、我々の社会や生活を支える必要不可欠な基盤だ。同時にネットワークの運用は、サービスが多様化することでどんどん複雑化している。このような背景を受けてKDDIは、ネットワークの運用を自動化するシステムを開発。2021年度から運用を開始した。5年以上の歳月をかけてネットワーク運用者の「匠の技」を見える化しシステムに落とし込むことで、障害発生から復旧までの時間を最大40%短縮できるようにしたという。ますます重要になるネットワークの運用監視の今に迫る。

運用自動化システムを導入したKDDIのネットワーク運用拠点
[画像のクリックで拡大表示]
運用自動化システムを導入したKDDIのネットワーク運用拠点
(撮影:日経クロステック)

 「サービスがどんどん多様化する5G(第5世代移動通信システム)時代には、人手を介したネットワークの運用はもはや限界を迎える」。KDDIエンジニアリング取締役執行役員 運用保守事業本部長の上口洋典氏はこのように語る。

 KDDIはこのような時代背景から21年7月、同社のあらゆるサービス、ネットワークを一元管理し、障害が起きたときの復旧作業を自動化するシステムの運用を開始した。21年7月の東京・多摩地区の拠点を皮切りに、同年11月には冗長化を目的に大阪市に設けた拠点でも同様の取り組みをスタートした。

 筆者は先日、実際に運用自動化システムを導入したKDDIの多摩地区の拠点を見学した。壁一面のディスプレーに機器の状態などが表示される中にある、「KAGRA」と名付けられたコーナーこそ、新たに稼働を始めたネットワークの運用自動化システムである。

 このKAGRAによって、アプリケーションサーバーからネットワーク、交換設備、基地局装置などKDDIのすべてのサービスを一元監視しているという。サービスを基軸として、障害によってどれくらいの利用者に影響が出ているのか、障害の検知から復旧までの手順をこのシステムによってワンストップで対応できる。

これまで機能ごとに分かれていた運用監視業務をワンストップ化した
[画像のクリックで拡大表示]
これまで機能ごとに分かれていた運用監視業務をワンストップ化した
(撮影:日経クロステック)

 同社のこれまでのネットワーク運用監視体制といえば、サーバーやネットワーク、交換設備、基地局設備などを機能ごとに監視していたという。障害が起きた場合は、「機能ごとに人手で切り分け調査をし、情報統制者に集約。復旧作業に当たってきた」(上口氏)。

 だが機能ごとに人手に頼った運用では、今後ますます多様化するサービスの時代には復旧作業に多くの時間がかかることになりかねないと判断。運用自動化に向けたシステム開発をスタートした。

 新たに稼働を始めた運用自動化システムは、障害の検知から復旧までの手順をシステム側で自動判定し、運用者が手順を承認することで、ほぼワンタッチで復旧作業に当たれる。例えばあるネットワーク機器が故障した場合、その機器が本当に故障しているのかどうかを判断、故障している場合には予備系機器に切り替える、といった手順をシステム側が提示。運用者が承認することで、短時間で障害から復旧まで対応できるようにしている。

自宅などからリモート監視できるような体制も整える予定という
[画像のクリックで拡大表示]
自宅などからリモート監視できるような体制も整える予定という
(撮影:日経クロステック)

 運用自動化システム導入によって、ネットワークの運用監視に当たる人員を半減できたという。今後は、自宅などからリモートでネットワークの監視できるようにしていきたいという。