web-dev-qa-db-ja.com

ZFSミラーのチェックサムエラーについてどの程度心配する必要がありますか?

私は自作のFreeNASシステムを持っています。それは純粋にストレージのために1つのZFSプールで4つのHDDを使用し、起動のためにZFSミラーで2つのミラー化された16GBUSBメモリスティックを使用します。安定しており、約8ヶ月間稼働しています。ただし、夜間の電子メールは通常、次の行に沿っています。

Zfsプールのステータスの確認:
名前サイズALLOC FREE EXPANDSZ FRAG CAP DEDUP HEALTH ALTROOT 
 freenas-boot 14.5G 1.67G 12.8G --- 11%1.00xONLINE-
 volume1 7.25 T 457G 6.80T-2%6%1.00xオンライン/mnt


プール:freenas-boot 状態:オンライン ステータス:1つ以上のデバイスで回復不能なエラーが発生しました。エラーを修正するために が試行されました。アプリケーションは影響を受けません。 アクション:デバイスを交換する必要があるかどうかを判断し、「zpoolclear」を使用してエラー をクリアするか、デバイスを「zpoolreplace」に置き換えます。 を参照してください。 : http://illumos.org/msg/ZFS-8000-9P スキャン:スクラブは0h6mで232Kを修復し、2016年10月23日03:51:22にエラーは0でした config:
NAME STATE READ WRITE CKSUM freenas-boot ONLINE 0 0 0 mirror-0 ONLINE 0 0 0 gptid/253f05a3-be26-11e5-8d9c-d05099c04470 ONLINE 0 0 1 gptid/879584e0-bfb0-11e5-ba20-d05099c04470 ONLINE 0 0 9
エラー:既知のデータエラーはありません

チェックサムエラーが時々増加し、その後、通常のFreeNASアップデートを実行すると、すべてが再び0にリセットされ、プロセスが繰り返され、チェックサムエラーが何度も忍び寄ります。

HDD自体に障害があることを示すものは何も見られません。変更を加えるときにFreeNAS設定を外部バックアップ場所にダウンロードするので、必要に応じて新しいフラッシュドライブに再インストールできるはずです。

そうは言っても、これらのチェックサムエラーについてどの程度心配する必要がありますか?

2
James Thorpe

考えられる原因

これらのエラーにはさまざまな原因が考えられます。一般的なものには次のものがあります。

  • 不安定な接続または損傷したケーブル
  • 突然の電力損失またはデバイスの強制的な取り外し
  • 非ECCを使用している場合のメモリエラーRAM障害があります

エラーは(zpool clearの代わりに)少なく、各デバイスの同じブロックに影響を与えなかったため、too many errorsでエラーをクリアできます。 FreeNASのアップグレードもこれを行うので、あなたが説明した状況になると思います。

可能な解決策

私は次のことをします:

  • Memtest86 +を一晩実行して、メモリ内の障害を除外します
  • すべてのケーブルを切断して再接続し、接続が失われていないか確認し、必要に応じてケーブルを交換します(ケーブルは安価であるため、トラブルシューティングよりも簡単に交換できます)
  • エネルギー供給が不安定な地域に住んでいる場合は、UPSで実行すると違いが生じるかどうか試してください(米国の一部の地域では電圧低下が問題になっています、私は読んだことがあります)
  • 別のUSBポート/コントローラー、またはPCIeアダプターカード(かなり安価)を使用して、USBポート/コントローラーに障害があるかどうかをテストします。
  • 別のタイプのUSBスティックを使用してみてください。SLCベースのUSB3スティックで良い経験をしました(取り外しまたは停電時にチェックサムエラーのみが発生しました)
2
user121391