単一のESXIホストで非常に奇妙な問題が発生しています。
私は2つの同一のホスト、コアi3、6 nics、16g ramを持っています。 4つのNICは、すべて異なるVLANで、管理、vmotion、vmネットワークに使用されます。それらはすべて、静的トランク内のHP Procurve 24ポートギグスイッチに行きます。他の2つのNICはiSCSIです。
2つのVSSがあります。1つは4nicsで、もう1つは2とiSCSIトラフィックのみです。
両方のホストの構成は同じであり、ハードウェアも同じです。両方のホストは、CPUとメモリの両方で約30%の使用率で実行されています。 ESXI v。5.1を実行しています。
何が起こっているのかというと、突然のホスト2はすべてvCenterからドロップアウトします。 (vCenterは物理マシンでホストされています)。エラーはありません。接続が失われるだけです。
VCenterからホストにpingを実行しようとすると、できません。ワークステーションからpingを行おうとすると、ほとんどの場合、SSHで接続できます。 DCUIから「管理ネットワークをテスト」すると、ゲートウェイとDNSサーバーにpingを実行できます。管理ネットワークを再起動しても、vCenterからアクセスできません。
Services.shを再起動すると、エラーなしですべて完了しますが、役に立ちません。ホストは、vCenterに登録することも、vCenterからpingを実行することもできません。
これを改善する唯一のことは、ホストを完全に再起動することです。ログのエクスポートを行いましたが、この時点で何を探すべきかさえよくわかりません。どのログを見る必要がありますか?私が追加できる他の唯一の情報は、これが1日の同じ時間、早朝に発生しているように見えるということです。現在、何も実行されていません。バックアップジョブはありません。
ホワイトボックスハードウェアでこれらの問題が発生した場合は常に、関連する重要なコンポーネント(NIC、ストレージ)のドライバー(およびファームウェア)を確認し、 VMwareパッチポータル を使用してESXiディストリビューションの最新リビジョンに更新することをお勧めします。 =またはUpdateManager。
ラボまたはラボなし、古いビルドを実行しています:ESXi 1065491と現在のESXi 1483097。
最初に、更新を実行します。 VMware ESXi 5のパッチは累積的ですか?
その後、実際のホストのログを調べて、vCenterの切断時間近くに何が起こっているかを確認します。小切手 /var/log/hostd.log
および/var/log/vmkernel.log
。
ファイアウォール、DNS、またはその他のネットワークの問題がないことが確実な場合は、これが何が起こっているのかを理解する最善の方法です。
他のすべてが失敗した場合、これはisESXiであり、ストレージを共有しています。このようなビルドのトラブルシューティングに時間を費やしても、特に他のホストのパフォーマンスが良好な場合は、必ずしも役立つとは限りません。 PowerCLIを介して設定をコピーします 、再構築し、 復元 ホスト。