web-dev-qa-db-ja.com

RAID5リカバリプロセス

最近、サーバーのミラーリングとオンラインバックアップ用に3ドライブの4TB MDRAID5アレイをセットアップしました。

私は将来のハードウェア(ドライブ)障害に備えており、UREからの回復障害を軽減したいと考えていました。

通常、アレイを再構築するプロセスは次のように考えます。

  1. 故障したドライブを取り外して交換します。
  2. アレイを再構築する

私の理解では、劣化したRAID 5アレイでも、データにアクセスできます。ただし、故障したドライブが交換され、アレイが再構築されている場合、UREが検出されると、リカバリは失敗し、アレイ上のデータはすぐに読み取り不能およびリカバリ不能になります。

私の理解が正しければ、すべての(読み取り可能な)データが複製されるまで配列を回復することは賢明ではないようです。

これは私に次のプロセスを残します:

  1. 配列からデータを複製します。
  2. 故障したドライブを取り外して交換します。
  3. アレイを再構築する

再構築の失敗を軽減する別のプロセスはありますか(再構築中の2番目のドライブの障害は別として)?最初にデータを複製せずにアレイを再構築しても安全ですか? UREで再構築が失敗するなど、私の仮定は間違っていますが、データは劣化した状態でまだ利用できますか?

4
Damon

UREはアレイの障害に関連しているため、少し複雑でほとんどの人には不明であることに気付きました。

結論はREはアレイの障害を引き起こす可能性がありますが、記事の数学が言うほど頻繁ではありません。しかし、RAID 5は、他のすべてのRAIDレベルと比較して非常に障害が発生しやすいRAIDアレイです。

では、基本に戻って、RAID 5の再構築中に何を軽減するのでしょうか。 2番目のドライブに障害が発生する前にパリティを取り戻そうとしています。それだけです!これは、あらゆる手段で必要な作業です。

これは私のリストを固めることにつながります

  1. アレイからデータを一時的に複製します。アレイが大きく、HDDスペースが利用できない場合は、テープが最も安価です。
  2. 故障したドライブを取り外して交換します。
  3. 新しいドライブを使用して新しいアレイを最初から構築します。
  4. 手順1からファイルを新しいアレイにリロードします。

これは、アレイをオフラインにできることを前提としていますが、常にそうであるとは限りません。しかし、最終的には、新しいアレイを最初から構築し、データを一挙に転送する方が、大規模なマルチTBアレイで完全な再構築を試みるよりも、簡単かつ迅速であるという同じことを発見した人もいます。 。

さらに、データの読み取りとアレイからのデータの書き込みを1回だけ効果的に劣化状態で行うと、完全なスラッシング再構築と比較して、データが複製される前に2番目のドライブ障害が発生する可能性が大幅に低下する可能性があります。そこ。

結局のところ、そのすべては、特定の状況の過多によって異なるリスク管理に関するものです。私の特定のケースでは、通常、24時間以内にアレイを復元する時間を見つけることができるため、新しいバックアップ、再構築、および新しいバックアップからの復元が最適です。

0
Damon

3-2-1バックアップ計画、私の個人的な意見3-を実装することで、ドライブの障害や他のすべてのトラブルに備えることができます。 2-1は、各ビジネスクリティカルな環境にある必要があります。

3-2-1ルールに従うと、生活が楽になります。これは明らかに$の費用がかかりますが、結果はそれだけの価値があるはずです。

詳細については、こちらをご覧ください: https://knowledgebase.starwindsoftware.com/explanation/the-3-2-1-backup-rule/

https://www.veeam.com/blog/the-3-2-1-0-rule-to-high-availability.html

6
Net Runner