PR

LANスイッチの故障に伴うネットワーク障害は,スイッチや配線の2重化といった,定石の冗長化だけでは必ずしも回避できない。故障の部位によってトラブルの現象や対策は異なるため,ネットワーク設計に際してはスイッチの内部構造まで勘案したトラブル回避策を練る必要がある。

 業務の継続性を確保する上で,ネットワークの冗長化は避けて通れない。LANを冗長化する場合は通常,ネットワーク機器を並列に設置して複数の経路を設ける。こうしておけば,ネットワーク機器に障害が発生しても別の経路を使って通信を継続できる。

 ただ,トラブルの内容は障害個所や原因によって違う。例えばネットワーク機器のハードウエア故障でも,電源,LANポート,CPUのどこが壊れたかによってトラブルの現象が異なり,故障個所によっては単純に複数の経路を設けただけの冗長化では回避できないことがある。ネットワーク担当者は,スイッチの各部品の故障を含め,あらゆるトラブル原因を想定した上でネットワークを構築することが大切である。

STP使う冗長化に盲点,VLANの経路阻害を防げ

 LANスイッチの持つ冗長化技術として,STP(spaninng tree protocol)がよく知られている。しかし,その仕組みを熟知している人は少ないかもしれない。仕組みを正しく理解した上で,あらゆる障害パターンを洗い出し,障害を想定して設計することが重要だ。

特定のVLANだけが通信できない

 いくつものサーバーを設置しているA社のサーバー・ルームでは,アクセス数の増加に伴い,業務サーバーと業務サーバーを接続するLANスイッチを増設した(図1上)。サーバー・ルームのLANはすべて1000BASE-Tで構成しており,今回の増設も1000BASE-Tとした。

図1●B社はSTPでサーバー・ルームのネットワークを冗長化した<br>障害時の通信経路を想定していたが,実際にはVLAN20をブロッキング・ポートでふさいでしまった。
図1●A社はSTPでサーバー・ルームのネットワークを冗長化した
障害時の通信経路を想定していたが,実際にはVLAN20をブロッキング・ポートでふさいでしまった。
[画像のクリックで拡大表示]

 増設ではレイヤー3スイッチ(L3SW)のポート数を節約するために導入したレイヤー2スイッチ(L2SW)C/Dに,L2SW E/Fを接続。冗長性を保持するためにSTPを採用し,各VLAN(仮想LAN)で十分な通信帯域を確保するために,L2SW E/Fをつなぐう回経路をVLANごとに1本ずつ用意した。

 L2SW E/Fには,1000BASE-Tインタフェースを持ちSTPをサポートするLANスイッチの中で最も安い製品を選んだ。既存サーバーと同様にNIC冗長化技術を使って,サーバーのNIC故障やリンク障害時でも業務を継続できるよう設計した。STPのルート・ブリッジはL2SW Cとして,正常時のブロッキング・ポートを決めた。

 業務サーバーを追加してから数カ月後の業務時間中に,L2SW DとEを接続していたツイストペア・ケーブルの故障によって両スイッチ間が不通となっていた。この障害は想定済みで,う回経路の利用で業務を継続できるはずだった(図1中)。しかし実際は,業務システムに一部の利用者がアクセスできなくなっていた。状況を聞くと,どうやらVLAN20に接続したサーバーにアクセスできないようだ。

 う回経路は,VLANごとに十分な通信帯域を確保するために2本のリンクを用意した。しかしVLAN20だけがう回経路を使った通信ができなかった。

 この理由は,IEEE 802.1D準拠のSTPはVLANではなく,物理的なループ構成だけに有効なプロトコルであるという前提があるからだ。複数のVLANが存在してもSTPのドメインは一つで,ブロッキング・ポートはVLANに関係なく決定される。