web-dev-qa-db-ja.com

RAM ECCが機能しているかどうかを確認する方法は?

一部のECCを取得する予定ですRAM非ECCを置き換えるためにRAM現在、Asus M5A97 Proマザーボード(AMD 970チップセット、FX -6100 CPU)。

RAMをインストールした後RAMのECC機能が正しく動作しているかどうかを確認するにはどうすればよいですか?

dmidecode --type memoryは現在、RAMスティックごとに他の中で印刷します:

Error Information Handle: Not Provided
Total Width: 64 bits
Data Width: 64 bits

(1つには、1バイトあたり1ビットのECCを使用すると、データ幅は64ビットのままですが、合計幅は72ビットを読み取ることができます。)

ECCが機能しているかどうかを判断するために使用できますか?それとも、dmidecodeのレベルが低すぎますか?他に何を使用できますか(待機していて、ECCエラーがログに表示されるかどうかを確認しますが、これは動作しているが動作していないことを示します)?

pdate:私は後でedac-utilsについて考えました。それらをインストールすると、Not enabling Memory Error Detection and Correction since EDAC_DRIVER is not set。それでedac-utilおよびedac-ctl実行可能ファイル。それらの1つをこの目的に使用できますか?

19
a CVn

確実に伝える方法はありません のようですが、さまざまなアプローチで何らかの答えを得ることができます。どうやら、ECCが機能していることを伝えるものが見つかるまで、さまざまなものを試してみる必要があります。

私の場合 memtest86 + 4.2 は、ECC RAMを処理していることに気付かせることができませんでした。 ECCをオンに構成しても、ECC: Disabled IMC行。新しいバージョンではまだ試していません。ただし、(おそらくedac-utilsをインストールした後、残念ながら私は両方を本質的に同時に実行しました)、Linuxはブートログでレポートします(他のいくつかのエントリが散在しています)。

[    4.867198] EDAC MC: Ver: 2.1.0
...
[    4.874374] MCE: In-kernel MCE decoding enabled.
[    4.875414] AMD64 EDAC driver v3.4.0
[    4.875438] EDAC AMD64: DRAM ECC enabled.
...
[    4.875542] EDAC AMD64: CS0: Unbuffered DDR3 RAM
[    4.875545] EDAC AMD64: CS1: Unbuffered DDR3 RAM
[    4.875546] EDAC AMD64: CS2: Unbuffered DDR3 RAM
[    4.875548] EDAC AMD64: CS3: Unbuffered DDR3 RAM

これはかなり良い兆候です。手動で/etc/init.d/edac restartは同様のログエントリを作成せず、数回のリブート前の古いログを確認すると、次のようになります。

[   13.886688] EDAC MC: Ver: 2.1.0
[   13.890389] MCE: In-kernel MCE decoding enabled.
[   13.891082] AMD64 EDAC driver v3.4.0
[   13.891107] EDAC AMD64: DRAM ECC disabled.
[   13.891116] EDAC AMD64: ECC disabled in the BIOS or no ECC capability, module will not load.
[   13.891117]  Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
[   13.891118]  (Note that use of the override may cause unknown side effects.)

dmidecode --type memoryは、2つの非常に強力な指標も提供します。物理メモリアレイの「エラー修正タイプ」プロパティ(ただし、何らかの理由で ECC RAM以外でも同じ なので、これはマザーボードのサポートに関連している可能性があります)メモリの機能ではなく)、

Handle 0x0026, DMI type 16, 23 bytes
Physical Memory Array
    Location: System Board Or Motherboard
    Use: System Memory
    Error Correction Type: Multi-bit ECC

各メモリデバイスの合計幅とデータ幅(追加のビットはECCに使用されるビット):

Handle 0x0028, DMI type 17, 34 bytes
Memory Device
    Array Handle: 0x0026
    Error Information Handle: Not Provided
    Total Width: 72 bits
    Data Width: 64 bits
13
a CVn

サーバー/ PCへのコンソールアクセスがあり、再起動できるという条件で、これを行うには非常にシンプルで効果的な方法があります。 memtest86 +

この気の利いたツールは、メモリがECC対応かどうかをすばやく表示します。また、実際のテストを行うときに、ECC検証を実行すると思います。

これは(少し古い)スクリーンショットです: enter image description here

6
pauska