幸運なことに、すべてのサーバーに複数のNIC/HBA/CNAが複数のスイッチに接続されており、このアプローチにより、プラットフォームが何度も稼働し続けています。先週、修正方法がわからないという問題が発生しました。
トラフィッククラッシュのかなりの部分を運んでいたスイッチがありました(詳細は重要ではありませんが、Cisco 6509であり、ハードCPUクラッシュが発生し、自動的に復帰しませんでした)。残念ながら、ラインカードは機能したままでしたが(つまり、L1とL2がアップ)、すべてのアップリンクが失われました。接続されたサーバーは次のとおりです。
これらのマシンはすべて、クラッシュしたスイッチの検出に失敗し、障害を検出してトラフィックを別のスイッチに移動するのではなく、トラフィックを送信し続けました。
マルチパスを改善するためのオプションを検討するのに助けが必要です。これが初めて発生することはありません。これを行うには他の方法が必要です(たとえば、HSRPインターフェイスをポーリングする)。
前もって感謝します。
Cisco 6509とサーバ間のスイッチもCiscoである場合、1つ(または複数)のポートがダウンした場合にすべてのポートをシャットダウンするオプションがあります。 「アップストリーム」ポートと「ダウンストリーム」ポートのセットを設定します。すべてのアップストリームポートがダウンすると、スイッチはダウンストリームポートをダウンします。
これはリンクステートトラッキングと呼ばれ、あなたのような状況向けに設計されています。
あなたは少しの情報を見つけるでしょう このページで 。