Webシステムの応答速度が遅く、次の画面になかなか進まない。しかし、一応は利用できる。このような状況だと明らかなエラーは発生していないので、トラブルの原因を特定しづらい。アプリケーションからサーバー、ネットワークまで、広範囲から問題を切り分ける必要がある。
今回紹介するトラブルは、まさにこうしたケースだった。SCSKの山科 正幸さんはパケット解析装置を活用するなどして、トラブルの発生場所を早期に特定した。一体どのようにして特定したのか。トラブル解決までの流れを見ていこう。
始業時のログインに時間がかかる
トラブルの舞台になったのは、SCSKの顧客であるA社である。2020年春のある日、山科さんのもとに、A社のシステム担当者から「社内システムへのログインに時間がかかる原因の調査に協力してほしい」という依頼が来た。A社の各拠点の社内ユーザーがWAN経由で利用するWebベースのシステムでトラブルが発生した。
A社は、SCSKが扱う米ネットスカウトシステムズのパケット解析装置を導入している。この装置で、システムがあるデータセンター(DC)と拠点間の通信を監視していた。山科さんは「『トラブルの原因がなかなか見つからないので、装置を役立てられないか』という相談でした」と話す。今後のシステム運用を考えて、装置の活用方法を学びたいという考えもA社のシステム担当者にはあったようだ。山科さんに声がかかったのは、装置の導入支援を担当していたからだ。
A社は当時、システムを移行している最中だった。移行が進んでユーザーが増えるにつれて、「ログインするまでに時間がかかりすぎる。どうにかならないのか」という問い合わせが増加していった。システムのログイン画面でユーザー名とパスワードを入力してログインボタンをクリックした後、次の画面が表示されるまでに何十秒も待たされる状況だった。しかし、エラーやタイムアウトは起きてはいなかった。
このため新システムへの移行は中断を余儀なくされた。「移行済みのユーザーには利用し続けてもらって、移行していないユーザーには旧システムにとどまってもらっているとのことでした」(山科さん)。旧システムは、サーバーの保守などの関係で使用期限があった。このためA社としては、早く移行を再開したかった。
山科さんは連絡を受けた数日後にA社を訪問して調査を始めた。システム担当者に話を聞くと、ログイン時の応答速度の低下は、朝の始業時の前後に多く発生していた。システムへのログインが集中する時間帯だ。それ以外の時間帯で低下することはほとんどなかった。「時間をずらして出社した人は問題なくログインできるとのことでした」(山科さん)。