ESXホストがiSCSI SAN vmfsボリュームとの接続を失うという、この問題が2か月間発生しています。
その結果、ESXホストは非応答モードになり、関連するVMが切断され、唯一の解決策はホストを再起動することです。
この問題はランダムに発生します。この問題をVMWareでエスカレーションしましたが、まだ問題の解決策がありません。
スイッチにエラーは表示されず、ハードウェアの問題もありません。私のSANインフラストラクチャは安定しており、vmfsボリュームごとに2つのパスがあります。
他の誰かが同様の問題を経験しましたか?
編集:ここにいくつかの詳細があります:
ISCSI SANソフトウェアは2台のHPProliantG5サーバーで実行されるDatacoreSanmelody2.0.4.2です。各サーバーに接続されているストレージはHPMSA70であり、すべてのiSCSI SAN 4つのESXホストに提示されるボリュームがミラーリングされます。
一緒にトランクされた2つのiSCSIスイッチHPProcurve1800G-24があります。私のSANLELODYサーバーはNC360TNICを使用しています。私は2つのNICをチーム化し、各iSCSiスイッチに接続するケーブルを1本持っています。各ESXサーバーは、iSCSIネットワークにも2つのNICを使用します。
もう少し複雑な方法を試してみましょう。他のiSCSIソリューションを使用して、ESXの問題なのか、iSCSI自体なのかを確認してください。
私はあなたをお勧めします StarWind 。そこから試用版をダウンロードできます。
このシナリオを適切に診断するには、ESXのバージョンを知る必要があります。
ESX 3.5 Update 3でしばらく前にこの問題が発生しました。解決策は、 このKB記事 に従ってホストを更新/パッチすることでした。アップグレード後、アップデート4(およびそれ以降)に問題が再発することはありません。
すでにこのパッチを過ぎている場合は、バージョンに関する詳細と、ESXホストの1つからの診断データを提供できますか?通常、vmkernel.logから始めるのが適切です。
たぶん、説明されているように、iscsi pingを無効にする必要があります ここ
ESXi 4、HP Procurveスイッチ、およびHP LefthandSANで非常によく似た問題が発生しました。私たちの問題は、ハードウェアiSCSIイニシエーターは機能していましたが、99%の時間しか機能しなかったため、ランダムなロックアップや切断などが発生したことでした。BroadcomNIC(ハードウェアiSCSIを使用)は左側のSANと互換性がないことが判明しました。ソフトウェアiSCSIイニシエーターを使用すると、問題が解決しました。