web-dev-qa-db-ja.com

カーネル:EDAC MC0:UEページ0x0は不良メモリ、ドライバー、またはその他のものを指しますか?

kernel: EDAC MC0: UE page 0x0, offset 0x0, grain 0, row 7, labels ":": i3200 UE

突然、今日、私たちのCentOSリリース6.4(最終)システムはEDACエラーをスローし始めました。再起動するとエラーが発生しなくなりました。

私は答えを探していましたが、それらはメモリまたはチップセットの2つのグループに分類されます。これをチップセットまたはメモリに絞り込むためにさらに検索する場所についてのアドバイスをお願いします。

8
octopusgrabbus

発生しているのは エラーの検出と修正 イベントです。エラーがこのビットを含んでいるとすると:MC0メモリエラーが発生しています。このメッセージは、具体的にエラーが発生している場所を示しています。 MC0はRAM最初のソケット(#0)を意味します。そのメッセージの残りの部分では、具体的にはそのRAM DIMM内でエラーが発生しました。

1つしか取得できない場合は、引き続き監視しますが、当面は何もしません。それが続く場合は、メモリモジュールの障害が発生している可能性があります。

memtest86 + を使用して、より徹底的にテストすることもできます。

この前の質問のタイトル: 正しい不良をブラックリストに登録する方法RAM MemTest86 +エラー文書に従ってセクター? は、それに興味がある場合にメモリをブラックリストに登録する方法を示します同じように。

9
slm