問題
すべての32GBのRAM=がインストールされている場合、システムは常にMemTest86 + 6.2に失敗します。この失敗は常に最初のパス中に発生し、エラーは数百万のエラーにすぐに上昇します。Windowsを実行しようとすると、ランダムな再起動と停止エラー(RAMエラーで予想されるように)。
私が試したもの
Bad RAM and bad RAM sockets。theonlyMemTestテストが失敗するのは、4つの8GBモジュールがすべて同時にインストールされている場合です。
PSUからの電圧を測定しましたが、4つすべてのスティックを取り付けても、そこにあるすべてのものが安定しているように見えます。
これを書いているとき、私はBIOSでRAM速度を1066MHzに手動で下げるという最後の手段を試しました。これまでのところ、MemTestは1つのパスを完了し、エラーなしで2番目のパスにあります。 (上記のテストはすべてネイティブの1600MHzで実行されましたRAM速度。)これにより、システムが使用できる場合があります。ただし、少し遅いRAM速度ですが、これは恒久的な修正ではないようです。
MemTestエラーが発生するたびに、それらは常に64ビットアドレスバス上の同じ正確な位置に発生します。
Bit Error Mask: 00000000FF000000
さらに、エラーが4 GBの境界を下回ることはありません。つまり、すべてのエラーは4GBから32GBのアドレス空間で発生します。
これは、CPUとRAMとマザーボードの奇妙な相互作用またはタイミングの問題の一種であると推定しています。エラーは非常に一貫しているため、特定の1つの構成でのみ発生し、 RAMの速度を落とすことで緩和され、4GBの境界を超えてのみ発生します。私の質問は次のとおりです:CPUまたはマザーボードが原因である可能性が高いですか?
私はこのマシンをCore i7-4790Kにアップグレードするつもりだったので、CPUが原因である可能性がある場合(メモリコントローラーがこれらの新しいモデルのCPUにあることがわかっています)、アップグレードを計画しているため、問題なく動作しますとにかくそれが、マザーボード自体も問題の一部である可能性があるかどうか疑問に思っています。つまり、まったく同じ問題を経験し、マザーボードも交換する必要があることを確認するためだけに、i7 CPUにお金をかけたくありません...
助言?
編集:遅いRAM=速度でもエラーが発生しましたが、テストが3番目のパスに達したときのみです。CPU自体の相互作用をテストするために、CPUを1つだけアクティブにしてテストを再開しました。
これは、コンポーネントに欠陥があるようではなく、互換性のない組み合わせを使用しています。
同じメモリバスに複数のソケットを実装すると、各データラインの容量が増加し、立ち上がり時間が遅くなるため、遷移が遅れて到着し、誤検出される可能性があります。この現象は「ファンアウト」として電気技術者に知られています。
メモリモジュールの内部にファンアウトがあるため、これはさらに複雑です。 「ランク」と呼ばれるモジュール上のDRAMデバイスの数とトポロジーは、並列に正常に接続できるモジュールの数に影響します。
多くのメモリソケットをサポートするサーバーマザーボードは実際にはバッファメモリを必要とします。これは、バッファのカスケードネットワークを使用して、各メモリから見られるファンアウト(したがって静電容量)を制限します。バッファ自体が原因で遅延が発生しますが、負荷の数に応じて対数的にのみ増加しますが、バッファなしのメモリ容量は直線的に増加します。
ウィキペディアはこれを議論します: https://en.wikipedia.org/wiki/Memory_rank
一部のマザーボードのマニュアルでは、このようなことを実際に説明しています。他の人は、RAM互換性リストから情報を推測できます。例として、ASUS Z170-Aマザーボードは、デュアルランク(DS = doubleマニュアルでは、4つのシングルランクDIMMを同時に使用するのではなく、ボード上の2つのスロットでのみ使用できます。
これは、プロセッサの 統合メモリコントローラ の問題のように聞こえます。
現代のシステムでは、マザーボードはメモリ管理において、メモリモジュールとプロセッサ間のパスを提供する以上の役割を果たすことはありません。レイテンシを最小限に抑えるために、メモリはプロセッサに直接接続されています。古いシステムのメモリをプロセッサに接続する " northbridge "は、プロセッサ自体の一部になりました。 (ファームウェアまたはPCHは、プロセッサがRAMを実行する方法を制御しますが、それが最終的にプロセッサの責任であるため、説明した種類のビットエラーを引き起こすことは意味がありません。)したがって、私が最初に行うことdこのような状況で疑わしいのは、IMCの障害です。
実際、発生している問題がマザーボードまたはシステムファームウェアのせいだとしたら、私は非常に驚きます。
そのマザーボードのBIOSについての悪いレビューがいくつかあります。まずBIOSの更新を確認します。マザーボードをけちるしないでください。
RAMにも欠陥があるように見えない場合でも、欠陥がある可能性があります。私のホームサーバーで最近アイスティーによる致命的な事故が発生しました...
各パーツを個別に交換するプロセス全体(2つのCPU、mobo、電源、16 GB(2x8GB)RAMの2つのバンク)を実行し、RAMの単一のバンクを使用しただけですべてが正常にテストされましたシングルCPU(トーストされた1 CPUを除く)。
私が使用した構成は問題ではありませんでしたalwaysは、単一のCPUとRAMのバンク(16GBまたは32GBのRAM)がある場合に機能しましたが、 2番目のCPUに入れてRAMを分割すると、バンクあたり16GBになり、サーバーの起動に失敗しました。
RAMの1つのバンクを完全に交換するまでは、最終的に正常に起動および実行されなかったので、それからずっとそうです。
tl; dr:@moabが彼のコメントで述べたように、互換性のあるシステムですべてのコンポーネントをテストするまで、確実に言うことはできません