web-dev-qa-db-ja.com

「大規模な」RAID 5アレイとして何がカウントされますか?

Buffalo TeraStationの最近の問題NASここの私のオフィスでは、Raid 5を調査しました。

大規模なアレイまたは大容量のディスクでraid 5を使用することの不適当さについて話しているいくつかの異なる記事を見つけました

これが1つです サンプル記事 大容量のコンシューマードライブでアレイを再構築する際の問題について説明しています。

「大」と見なされるものを解決しようとしていますか?

NASここに4ドライブのRAID 5セットアップがあり、各ドライブは1 TBです。ドライブに障害が発生し、交換されました。アレイは現在再構築中です。

再構築中に問題が発生する可能性があるという点で、このセットアップは同じくらい大きなものになりますか?

このセットアップは、日常の使用に対してどの程度信頼できますか?

11
Rob

ディスクアレイの信頼性の設計:

  1. ドライブのUREレートを確認します(製造元はドライブの故障について話したくないので、これを見つけるために掘る必要があるかもしれません。1/ 10 ^ Xである必要があります(Xは通常12から18程度))。
  2. ストレージのニーズに対して許容できるリスク率を決定します†。通常、これは障害の可能性が0.5%未満ですが、「スクラッチ」ストレージでは数パーセントになる可能性があり、重要なデータの場合は0.1未満になる可能性があります。
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    ミラーのペアのディスクが2つ以上あるパリティのディスクが複数あるアレイ、またはアレイ内のドライブの後の_1_を、パリティ/ミラーを持つディスクの数に変更します。

だから私はアレイに4つの1TB WD Greenドライブのセットを持っています。それらのUREレートは1/10 ^ 14です。そして、私はそれらをスクラッチストレージとして使用します。 1 - (1 - 1TB x 1/10^14byte) ^ 3 => _3.3%_ 1台のドライブが停止した後、アレイの再構築に失敗するリスク。これらは私のジャンクを保存するのに最適ですが、そこには重要なデータを入れていません。

†許容できる障害の特定は、長く複雑なプロセスです。 _Budget = Risk * Cost_として要約できます。したがって、失敗の費用が100ドルで、発生する可能性が10%の場合は、それを防ぐために予算を10ドルにする必要があります。これにより、リスク、さまざまな障害のコスト、および潜在的な予防手法の性質を判断するタスクが大幅に簡素化されますが、アイデアは得られます。‡_[Data Drives] = [Total Drives] - [Parity Drives]_。 2つのディスクミラー(RAID1)とRAID5には1つのパリティドライブがあります。 3つのディスクミラー(RAID1)とRAID6には2つのパリティドライブがあります。 RAID1またはカスタムスキーム、あるいはその両方でより多くのパリティドライブを使用することは可能ですが、非定型です。


ただし、この統計式には注意点があります。

  • そのUREレートはアドバタイズされたレートであり、通常、組立ラインからロールオフするほとんどのドライブで優れています。あなたがラッキーになり、宣伝されているよりも桁違いに優れているドライブを購入する可能性があります。同様に、乳児死亡率で死ぬドライブを得ることができます。
  • 一部の製造ラインには不良ランがあります(ラン内の多くのディスクが同時に失敗します)。そのため、異なる製造バッチからディスクを取得すると、同時失敗の可能性を分散させることができます。
  • 古いディスクは、再構築のストレス下で死ぬ可能性が高くなります。
  • 環境要因が犠牲になります:
    • 通常、ヒートサイクルされるディスクは、より頻繁に停止します(たとえば、定期的に電源をオン/オフにします)。
    • 振動はあらゆる種類の問題を引き起こす可能性があります-YouTubeのビデオ ディスクアレイで叫んでいるIT のビデオを参照してください。
  • 「嘘には、嘘、大嘘、統計の3種類があります」-ベンジャミン・ディズレーリ
18
Chris S

この記事が存在する理由は、HDDの回復不能なビットエラーレートに注意を引くためです。具体的には、安価な「ホームPC」ディスクです。通常、工場仕様は1/10 ^ 14です。これは約12.5TBのデータであり、2TBのディスクでRAID-5を実行している場合は、すぐにヒットします。

これは、次のいずれかを行う必要があることを意味します。

  • より小さなRAIDグループを使用し、より多くの無駄なスペースを受け入れます。
  • RAID-6を使用し、追加の書き込みペナルティを受け入れます。 (RAID5より50%高い)
  • より高価なディスクを購入する-「サーバーグレード」のUBER仕様は1/10 ^ 16です。これは、これが重要なポイントであることを意味します。 (1.2PBは12.5TBよりも優れています)

通常、RAID-6が一般的な方法ですが、パフォーマンスは低下します。

9
Sobrique