全4048文字
PR
サーバーをリモート監視する管理ツールにアクセスできなくなった。原因は管理ツールのアドレス解決に関するバグ。ルーターを入れ替えた際にARPテーブルが更新されず、新しいルーターと通信できなくなっていた。管理ツールを再起動すると解消した。

 リモート監視用の管理ツールを備えるサーバー製品が増えている。サーバーで動作する管理ツールにアクセスすれば、サーバーの稼働状況などをリモートから監視できる。サーバーの再起動なども可能だ。

 管理ツールの多くはサーバー本体とは独立して動作する。独自のファームウエアやNICなどを備えているので、サーバーに不具合が発生した場合でも、その原因などを調査できる。

 サーバーの障害復旧に役立つ管理ツールだが、本体と独立していることがあだとなる場合もある。サーバー本体は問題ないのに、管理ツールだけが正常に動作していないといったケースがあり得る。今回紹介するのは、まさにそのようなトラブルだ。

特定のサーバーでトラブル発生

 トラブルに遭遇したのは安達洋介さん。化粧品の製造・販売やビジネスホテルの経営などを手掛ける黒龍堂で社内システムエンジニアとして働いている。

 安達さんがトラブルに遭遇したのは2021年3月上旬。安達さんは月例業務として、同社が運用する業務サーバーのCPUやメモリー、ハードディスク容量などを管理ツールで監視している。毎月問題なく実施している業務だが、このときはあるサーバーの管理ツールにアクセスできなかった。

 該当のサーバーは米ヒューレット・パッカード・エンタープライズ(HPE)の「ProLiant DL20 Gen10」。このサーバーでは仮想環境上でActive DirectoryやWindows Server Update Services(WSUS)などを稼働させている。

 このサーバー自体は問題なく稼働していた。その管理ツールである「iLO5」に、安達さんのノートパソコンからアクセスしようとしたができなかった。

トラブル発生時のネットワーク構成
トラブル発生時のネットワーク構成
同社では毎月1回、サーバーの状態を監視するための管理ツールに安達さんがアクセスして、CPUやメモリーなどに異常がないかをチェックしている。この管理ツールにアクセスできないトラブルが発生した。
[画像のクリックで拡大表示]

 すぐにでもトラブルの原因を特定して解消させたかったが、「このときは優先度の高い別の仕事を抱えていたので、すぐには取りかかれませんでした」(安達さん)。

 また面倒ではあるが、サーバーが置かれたサーバールームに足を運べば、稼働状況を目視で確認できた。このためトラブルの調査は後日に持ち越すことにした。