web-dev-qa-db-ja.com

MCEエラーコード/ピンクスクリーン-それらは問題の原因になるべきですか?

そのため、最近サーバーグレードのシステムとすべてのサーバーグレードの周辺機器を購入しました。私はESXi 6のライセンスを取得しており、最近のすべてのパッチがインストールされています。システムは約2週間稼働しており、突然、完全にクラッシュしました。

このエラーコードを「内部タイマーエラー」と解釈しました。私はその情報をSuperMicroに転送しましたが、正直なところ、これまでのところ彼らの反応には自信がありません。私の解釈では、システムはクラッシュしないはずです-ESXiを実行するECCメモリを備えたXeonだからです。

これが1回限りのエラーであり、再度発生しないようにすることは可能ですか?これをどのように扱いますか?これらのタイプのエラーを見た人からのアドバイスと、実際にエラーが発生する原因を探します。

Crash

6
davewolfs

このエラー(MCE、マシンチェック例外)は、ECC RAMがあるために発生します。

どこかに壊れたハードウェアがあります。おそらくメモリスティックですが、おそらく1つ以上のプロセッサ(CPU 10か?)またはその中間にあるものです。サポート契約を呼び出します。

ハードウェアの他のビットでもかまいませんが、これを確認するたびに、ECCに欠陥がありましたRAMマルチビットエラーが発生しています。MCEが「内部タイマーエラー」としてデコードされた場合、次に可能性が高いのは、CPUまたはメインボードの障害です。

3
Falcon Momot

はい、それは懸念の原因です。サーバーがクラッシュしました!

RAMおよびCPUソケットピン(サーバーを手動で組み立てた場合)を確認してください。

それはあなたが得るすべての情報についてです。 VMwareでサポートケースを開くと、クラッシュダンプが分析されます。

3
ewwhite