そのため、最近サーバーグレードのシステムとすべてのサーバーグレードの周辺機器を購入しました。私はESXi 6のライセンスを取得しており、最近のすべてのパッチがインストールされています。システムは約2週間稼働しており、突然、完全にクラッシュしました。
このエラーコードを「内部タイマーエラー」と解釈しました。私はその情報をSuperMicroに転送しましたが、正直なところ、これまでのところ彼らの反応には自信がありません。私の解釈では、システムはクラッシュしないはずです-ESXiを実行するECCメモリを備えたXeonだからです。
これが1回限りのエラーであり、再度発生しないようにすることは可能ですか?これをどのように扱いますか?これらのタイプのエラーを見た人からのアドバイスと、実際にエラーが発生する原因を探します。
このエラー(MCE、マシンチェック例外)は、ECC RAMがあるために発生します。
どこかに壊れたハードウェアがあります。おそらくメモリスティックですが、おそらく1つ以上のプロセッサ(CPU 10か?)またはその中間にあるものです。サポート契約を呼び出します。
ハードウェアの他のビットでもかまいませんが、これを確認するたびに、ECCに欠陥がありましたRAMマルチビットエラーが発生しています。MCEが「内部タイマーエラー」としてデコードされた場合、次に可能性が高いのは、CPUまたはメインボードの障害です。
はい、それは懸念の原因です。サーバーがクラッシュしました!
RAMおよびCPUソケットピン(サーバーを手動で組み立てた場合)を確認してください。
それはあなたが得るすべての情報についてです。 VMwareでサポートケースを開くと、クラッシュダンプが分析されます。