Hyper Vを使用して、ブレードの6ノードフェールオーバークラスターで多数のVMを実行しています。
VMがネットワーク接続を失うという断続的な問題(異なる時間に数日おき-固定頻度ではない)があります。 VMへのコンソールアクセスは、すべてが正常であり、基盤となるブレードが通常の接続を持っていることを示しています。問題を解決するには、VMまたは、通常は、接続を起動する別のブレードにライブマイグレーションを実行してから、元のブレードにマイグレーションして戻します。
特定のVMが特定のブレードで実行されている場合、これが3回発生しましたが、別のVMが別のブレードで実行されている場合、一度発生しました。 。すべてのVMとブレードの基本設定は同じで、Windows 2008R2を実行しています。
イベントログが役に立たないので、この問題の考えられる原因を診断するために探すべきアイデアはありますか?
編集:
各ブレードが最新のNICドライバーを実行していることを確認しましたが、すべて問題ないようです。
私を混乱させている何か-VMのフェイルオーバーまたは再起動は問題を解決します。NICがハングする原因となっている根本的な問題を解決する必要がありますが、= VMは、停止を解決する別のノードにフェイルオーバーしませんでした。VM)とわかるようにクラスターを構成する方法はありますか?ゲストが接続を失い、フェイルオーバーしましたか?現状では、問題が発生してもHyper Vがすべてが素晴らしいと言っているので、クラスターはVMが正常に実行されていると想定しています。
編集:
問題がまだ未解決であるため、これを更新すると思いました-頻度は低くなりますが、どのVMが影響を受けるかについては、ランダムに見えます。最新のチェックでは、すべてのVMが同じMPIOドライバーを実行していて、同じ仮想NICのドライバーバージョン。すべてが同じブレードセンターで実行されているが、このクラスターの外部にある一部のVMと同じように見え、これらのVMで問題が発生したことはありません。
私が望んでいた理想的な答えではありませんが、この場合、それは私たちのセットアップに役立ちました...
影響を受けたVMをクラスターから取り出し、NICを削除してから、再作成しました。併せて、各ブレードはクラスターから引き出され、引き戻される前にすべてのドライバーが更新されました。
接続の喪失の問題は、私がそれらを監視した次の6週間は明らかでした。その後の転職は、問題がまだ解決されているかどうかわからないことを意味します;)!
これがあなたの問題への答えでしょうか: http://support.Microsoft.com/kb/974909
たまたま、スイッチポートのポートセキュリティがオンになっていますか?十分な数のMACが許可されていることを確認してください。また、親のネットワーク構成はどのようになっていますか?チームを組んでいますか?