ZFS-RAIDZ-1は本当にそんなに悪いのですか?
NAS RAID10構成の4x 2TB WD RE4-GPドライブを搭載したサーバー(4TB使用可能)です。スペースが足りません(<1TB使用可能スペースが残っています)。より大きな/より多くのドライブ/エンクロージャに費やす。
既存のXFS(ソフトウェア)RAID10から切り替えるには、ZFSのデータ整合性機能について自分が読んだものが気に入っています。次に、ZFSのRAID5の優れた実装について読んだので、RAIDZ-1を使用すると、お買い得品で最大2TBの使用可能なスペースを確保できるかもしれません。
しかし、私は more と moreposts を読み続けて、RAIDZ-1を決して使用しないようにしています。 「実際の」ドライブ障害を処理するのに十分な信頼性があるのはRAIDZ-2 +だけです。もちろん、私の場合、RAIDZ-2は意味がありません。 1つのプール(RAID10)で2つのミラー化されたvdevを使用することをお勧めします。
RAIDZ-1を4x 2TBドライブに使用したいと思いますか?
2つのミラー化されたvdevのプール(基本的にRAID10)を使用するだけで、圧縮によって十分な追加スペースが得られることを望みますか?
いずれにせよ、私は圧縮を使用する予定です。 RAM(最大))は8GBしかないので、重複排除はオプションではありません。
これは、ZFS-on-Linuxの安定性の問題を回避するために、FreeNASサーバー(現在のUbuntu OSを置き換える予定)にあります。
詳細に入る前に、ユースケースを検討してください。写真、MP3、DVDリッピングを保存していますか?その場合、アレイから単一のブロックを永久に失うかどうかは気にしないかもしれません。一方、それが重要なデータである場合、これは災害になる可能性があります。
RAIDZ-1は「実際の障害には十分ではない」という声明は、再構築の時期になると、残っているディスクの1つで潜在的なメディアエラーが発生する可能性があるためです。同じロジックがRAID5にも適用されます。
ZFSはこの障害をある程度軽減します。 RAID5デバイスを再構築できない場合は、ほとんど運がありません。 (残りの)データをコピーして、ゼロから再構築します。一方、ZFSを使用すると、不良チャンク以外のすべてが再構築され、管理者はエラーを「クリア」できます。ファイル/ファイルの一部は失われますが、配列全体が失われることはありません。そしてもちろん、ZFSのパリティチェックでは、エラーが発生したことが確実に通知されます。それ以外の場合は、複数のエラーが原因で再構築が明らかに成功しているにもかかわらず、不良データが返される可能性があると思います(可能性は低いですが)。
ZFSは " Rampant Layering Violation "であるため、どの領域にデータがないかを認識し、再構築でそれらをスキップできます。したがって、配列が半分空の場合は、再構築エラーが発生する可能性が半分になります。
アレイの定期的な "zpool scrubs" または "mdadm check" を実行することにより、任意のRAIDレベルでこれらの種類の再構築エラーの可能性を減らすことができます。他のRAIDにも同様のコマンド/プロセスがあります。たとえば、LSI/Dell PERC RAIDカードは、これを「巡回読み取り」と呼びます。これらはすべてを読み取ります。これにより、ディスクドライブが障害のあるセクターを見つけ、永続的なものになる前にそれらを再度割り当てることができます。それらが永続的である場合、RAIDシステム(ZFS/md/raidカード/その他)は、パリティからデータを再構築できます。
RAIDZ2またはRAID6を使用する場合でも、定期的なスクラブが重要です。
最後に、RAIDはバックアップに代わるものではありません。誤って削除したり、ランサムウェアなどから保護したりすることはできません。通常のZFSスナップショットは、バックアップ戦略の一部になる場合があります。
ここでの作業には少し誤解があります。あなたが見ているアドバイスの多くは、真でないかもしれないという仮定に基づいています。具体的には、ドライブの回復不可能なビットエラー率。
安価な「ホームユーザー」ディスクには、10 ^ 14分の1の回復不可能なエラー率があります。
http://www.seagate.com/gb/en/internal-hard-drives/desktop-hard-drives/desktop-hdd/#specs
これは、RAIDの再構築中に回復不可能なエラーが発生する可能性が非常に高いため、行うべきではないレベルです。 (すばやく簡単に計算すると、5x 2TBディスクRAID-5セットには実際には約60%の確率でこれが発生します)
ただし、これは、より高価なドライブでは当てはまりません: http://www.seagate.com/gb/en/internal-hard -drives/enterprise-hard-drives/hdd/enterprise-performance-15k-hdd /#specs
10 ^ 16あたり1つは100倍優れています。つまり、5 TBの2 TBは、再構築が失敗する可能性が1%未満であることを意味します。 (企業で使用する場合、600GBスピンドルの方が一般的に有用であるため、おそらく少なくなります)。
したがって、個人的には、RAID-5とRAID-4の両方が依然として非常に使用可能であると思います。理由はすべて、RAID-0がまだかなり一般的だからです。忘れないでください-RAID-6の問題は、大量の書き込みペナルティです。大量のキャッシュでこれを部分的に軽減することはできますが、特に低速のドライブを最初から使用している場合は、依然としていくつかの困難が組み込まれています。
そしてより根本的に-完全な回復力を与えるためにRAIDを決して信頼しないでください。ドライブの障害よりも「おっと」する頻度でデータが失われるため、とにかくデータに関心がある場合は、適切なバックアップ戦略が必要です。
うーん、ここにいくつかの悪い情報があります。 4つのディスクの場合、XFSには何の問題もありません。パフォーマンスと拡張性の理由から、私はZFS RAIDZを避ける傾向があります(読み取り/書き込みが少なく、拡張できない)。可能であれば、ZFSミラーを使用します。ただし、4つのディスクがあり、OSを配置する場所がない場合、多くの容量が失われるか、奇妙なパーティション分割ゲームを実行して、OSとデータを同じ4つのディスクに収める必要があります。
おそらくユースケースにZFSをお勧めしません。ここでXFSに問題はありません。