8x Samsung 850 Pro 256GBSSDが接続されたLSI9207-8iコントローラーをテストしています。 SSDは最新のファームウェアEXM02B6Qを実行しており、コントローラーはP17を実行しており、P19でも同じ問題が発生しています。サーバーRAMはECCであり、ミラーモードでテストされています。
私はZFS-On-LinuxとFreeBSDでテストし、両方のオペレーティングシステムでLSIのドライバーを試しました。
ディスクは期待どおりに動作しますが、重いIOの場合、不良ブロックを書き込んでいるように見えます。ディスクでスクラブを実行すると、チェックサムエラーが表示されます。重いIOをシミュレートするために、recordsizeを使用しています。 primarycache = metadataおよびsecondarycache = noneの16kの。4GBのランダムファイルを生成し、これを4スレッドの別のファイルにddします。これを数回ループするだけで、スクラブでチェックサムエラーが表示されます。
ただし、これがコントローラー、SSD、またはケーブルの問題であるかどうかを確認します。 SSDを疑っていますが、次の機会に9211-8iでテストする予定です。
誰かが同様の問題を経験したことがありますか、またはコントローラー/ SSDの交換以外に次に何をすべきかについて誰かが何か提案がありますか?
更新:オンボードSATAコントローラーを使用して、まったく異なるサーバーでEXM01B6Qファームウェアを搭載した別のSamsung 850 Pro256GBをテストしました。チェックサムでも同じ問題が発生します。
私は過去にSamsung850Evoでもこの問題を抱えていました。ドライブは、OmniOS/OpenSolに配置された512Kとして表示されますが、ashiftパラメータがないため、この問題が発生します。ディスク自体にある種のガベージコレクションの問題があるようです。大量のデータを書き込んでスクラブし、エラーを確認します。
最終的に、ディスクをsd.confで4K整列として表示するように強制し、ZFSは適切に動作し始めました。
他の誰かが同じ問題にぶつかった場合に備えて、これを取り上げると思いました。
プールの作成時にashift = 12(4kアライメント)を設定することで問題を解決できました。
この構成に1つあると仮定すると、消費者向けのSamsung 850SSDまたはドライブバックプレーンが疑われます。
これは主に、2つの異なるオペレーティングシステムでエラーが発生しているためです。ハードウェア構成に関するその他の詳細を教えてください。