ネット君 あれー?パソコンがネットワークにつながらない。博士、助けてー。
インター博士 ん~、ちょっと待て。
ネット君 早く直してくださいよー。ネットの専門家でしょ。
インター博士 あのな、どんな状態か確認もしてないのに直せるわけないだろ。エンジニアは魔法使いじゃないんだよ。
ネットワーク管理者やネットワーク技術者なら、「ネットがつながらない!」という悲鳴をたびたび聞かされるだろう。「今すぐに直せ」と無理を言われることも少なくないはずだ。
とはいえ、すぐに直すことは難しい。ネットにつながらないといった障害が発生した場合には、「状況確認」「復旧」「原因究明」「原因対応」─という一連の作業を、順番に実施することが重要である(図1)。
よくあるのは、「復旧」よりも「原因究明」や「原因対応」を優先させる間違いだ。根本的な原因を明らかにして、今後同様の障害が発生しないようにしたいという気持ちはよく分かる。だが、原因の究明に時間がかかる場合には、ネットワークがつながらない状態が続くことになり、業務に支障を来すことになる。
そのような事態を防ぐために、状況を確認したら、すぐに復旧させる必要がある。障害の根本的な原因の究明やその対応は、復旧後に実施する。
障害箇所を「切り分け」
一口に「ネットにつながらない」といっても、症状は様々だ。「特定の端末やアプリケーションだけがつながらない」「有線LANはつながるが無線LANはつながらない」「特定のサーバーにだけアクセスできない」といった具合だ。そこで状況確認では、障害の症状や影響範囲、障害箇所などを特定する。特に、復旧のためには障害箇所の特定が不可欠だ。そのために実施する作業を、「障害の切り分け」と呼ぶ。
例えば、あるパソコンがサーバーにつながらない障害が発生したとする(図2)。その場合、サーバー以外の機器につながるかどうかを調べて、つながる範囲とつながらない範囲の「境界」を求める。これにより、障害が発生している箇所の当たりを付ける。
ネット君 水道管に例えると、どこかがつまっていて蛇口から水が出ないので、どこまで水が来ているのか調べて、つまっているところを探そうって話ですね。
インター博士 それは割と良い例えだな。