web-dev-qa-db-ja.com

マシンチェックの例外-それを読んで理解する方法は?

私のコンピュータは奇妙に動作します-時々自発的に再起動します、時々起動したくないです。コマンド「mcelog」を発行すると、次のような情報が表示されます。

HARDWARE ERROR. This is *NOT* a software problem!
Please contact your hardware vendor
MCE 0
CPU 0 BANK 0 
MISC 61f80000500010e ADDR cf9 
TIME 1305836650 Thu May 19 22:24:10 2011
MCG status:
MCi status:
Uncorrected error
MCi_MISC register valid
MCi_ADDR register valid
Processor context corrupt
MCA: BUS Level-3 Observed-error-as-third-party Generic Memory-access     Request-did-not-timeout Error
Model:Response hard fail
STATUS ae00030010020c03 MCGSTATUS 0
MCGCAP c0204 APICID 0 SOCKETID 0 
CPUID Vendor Intel Family 15 Model 4

どうすればそれを読んで理解できますか?誰かが私にいくつかのドキュメントを教えてもらえますか?

4
Piotrek

現在、マシンのオーバークロックの調整に取り組んでいるため、MCEエラーを調べています。最初にMemTest86 +ですべての悪い設定を見つけたので、私は何にも遭遇していませんが、私はそうするかもしれないことを知っているので、オーバークロックの変更後の最初の数ヶ月は定期的にそれらをチェックする必要があります。ハードウェアが限界をわずかに超えたときに発生する可能性があり、少しオーバークロックしすぎた兆候です。

次の行は重要です

「ハードウェアエラー。」

および「MCA:BUS Level-3 Observed-error-as-third-party Generic Memory-access Request-did-not-timeout Error Model:Responsehardfail」

他の行は、プロセッサのレジスタが障害を引き起こしていないこと、正確なエラー仕様、およびエラーによって影響を受けたものを正確に示しています。カーネル開発者またはマザーボード開発者でない限り、この情報は必要ありません。

エラーはメモリからのもののようです。これは、システムが起動していてエラーが発生するだけなので、一般にダイハード障害と呼ばれるものです。

以下は、メモリ、メモリコントローラ、またはバスの問題の一般的な原因です。 (問題を簡単に修正するために。_

  1. オーバークロックの問題。 (RAMが短すぎる、RAMバス速度が高すぎる。)のタイミング

  2. 電圧の問題(電圧RAMおよび/またはCPUがBIOSで間違って設定されている、低すぎるか高すぎる、またはボードが別の電圧RAM用に設計されている、たとえば1.65ボルトを置くRAM。)

  3. 過熱の問題(CPU RAMコントローラー、CPUキャッシュ、マザーボード、および/またはRAMが過熱しています。これは電圧の問題に関係している可能性があります。)

  4. 不良電源(これは大きな問題によるものです。)

  5. 不良メモリ(恐ろしいビットフェードテストを含むMemTest86 +でテストしてみてください。検出されてもメモリではない可能性があります。)

    6不正なBIOS(警告、メモリが不足しているときにBIOSをフラッシュするのは危険な場合があります。製造元のWebサイトをチェックして、メモリの破損を引き起こす問題がないかどうかを確認し、別のコンピュータにBIOSイメージをダウンロードして準備し、起動時BIOSを使用してくださいフラッシャー。使用中のリソースの量を最小限に抑え、問題が発生する可能性のあるものの量を最小限に抑えます。)

  6. マザーボードおよび/またはCPUの不良。 (これは明らかだと思います。)

Intel(またはAMD) システムプログラミングマニュアル はかつてMCEデコードのヘルプを参照する場所です(「マシンチェックアーキテクチャ」の章を参照してください)。ただし、これらはかなり密度の高いドキュメントです。また、マイクロアーキテクチャのリビジョンの違い、チップセットとCPUの問題などの雑草にすぐに取り掛かることができます。

0
P.T.

重要な行のみ、

未修正のエラー

メモリが不良か、マザーボードが不良です。 2つのうちの1つを交換して、再試行してください。 Memtest86を実行して、エラーがまだ発生しているかどうかを確認し、メモリをより遅いクロック速度で実行してみてください。

はんだ交換用チップを手渡す場合を除いて、他に何も重要ではありません。とにかくそうすることをお勧めするわけではありません。

0
stonefoz