web-dev-qa-db-ja.com

ディスクアレイの可用性を理解する

私はこれに慣れていないので、ディスクアレイの可用性(DAA)の計算について理解しようとしています。

これまでに理解したことは、可用性は常に1であり、障害= 1÷MTBFであり、それが朝から理解できるすべてです。

私が1TBを持っていて、期間が5年で、ディスクのMTBFが160万時間(15K RPMディスクについてはDellのWebサイトから入手))であると仮定すると、このディスクの可用性を知る必要があります。 5年間で、どのように計算するか、式は何ですか、MTTR、MTTDL、およびその他のMTTが表示され、混乱します。

もう1つの混乱は、RAIDにのみ関連するディスクアレイの可用性です。

誰かがDAAの計算方法を簡単な英語で説明できますか。

支援に感謝します。

現在、私はこれを参照として使用しています: http://www.ecs.umass.edu/ece/koren/architecture/Raid/reliability.html (この参照には、最小限の説明または説明のない式のみがあります)

誰かが簡単な英語で説明する他の良い参考文献を知っているなら。

ありがとうございました

3
Huud Rych

DAAは独立したディスクの冗長アレイであるため、RAIDアレイにのみ関連付けられていることは明らかです。

MTBFによると、日立からの情報は次のとおりです。

「MTBFターゲットはサンプル母集団に基づいており、中央値の動作条件下で統計測定と加速アルゴリズムによって推定されます。MTBF定格は、個々のドライブの信頼性を予測することを目的としたものではありません。MTBFは保証を構成するものではありません。」

HDDの場合、AFRを使用することをお勧めします—年間故障率( https://en.wikipedia.org/wiki/Annualized_failure_rate

WDは、ステートメントが非常に不明確で理解されていないという理由だけで、MTBF/MTTF仕様の使用を停止しました。

次のような信頼性に影響を与える多くの要因があるため、実際のHDDの寿命を計算することはできません。

1)温度

2)電源オン/オフサイクル

3)集中的な書き込み/読み取り

4)またはメーカーのソフトウェアまたはハードウェアからの発行

1
batistuta09

MTBFは単なる統計です。これは、あなたが予測しようとしていることには役立ちません。 20年間にわたるさまざまなメーカーのさまざまなディスクでの私の経験では、エンタープライズグレードの機器は、通常、通常の環境で見たいと思っているよりもはるかに長持ちします。はい、常にすべての10%の障害率がありますが、それがRAIDとバックアップの目的です。

とは言うものの、エンタープライズ環境の民生用機器は、思ったとおりに故障する傾向があります(つまり、保証期間が終了した直後)。ただし、WD Black/GoldディスクやSeagateEnterpriseディスクなどを実行している場合は、スピンアップが停止するずっと前に、それらが役に立たないほど小さい/遅いため、それらを取り除くことになります。 SSDには、残りの寿命を知らせるという追加の利点があるので、それがあります。

1
thelanranger

160万時間の平均故障間隔は182年です。つまり、182台のドライブを1年間実行すると、少なくとも1台が故障する可能性が非常に高くなります。年間故障率はこれの逆数であり、「1時間あたりの故障数」単位で表されます。

ベンダーはMTTFを誇張している可能性があります。

おそらく、これはコンシューマーディスクとエンタープライズディスクの関係に関係していますが、データにリスクを負わない方がよいでしょう。

平均修復時間(MTTR)は、ドライブの交換と再構築を含む完全な修復にかかる一般的な時間です。これは、ドライブに気づいて交換する日から、すでにアレイメンバーになっているホットスペアでゼロになるまで、大きく異なります。

まとめると、データ損失とは、障害の数がアレイの冗長性を超えた場合です。のように、アレイが劣化したときの二次障害。障害モード、およびその式は、RAIDレベルによって異なります。

RAID 5は、どのドライブでも2番目の障害になります。最初の障害は、MTTFをドライブの数で割ったものです。ただし、2番目は劣化したウィンドウ内にある必要があり、その可能性は( MTTR ) / ( MTTF / number of drives - 1 )です。両方を掛け合わせると、セカンダリドライブに障害が発生する可能性があります。

それは完全なドライブ障害でした。回復不能な(回復不可能な)読み取りエラーも重大な場合があります。 Backblazeが好むSegateST8000DM002のスペックは8 TBサイズで、10 ^ 14ビットごとに読み取りエラーがあります。(0.94%AFRと測定されました。)つまり、ドライブの完全な読み取りが行われる可能性があります。障害のあるセクターが64%の確率で発生します。ドライブは、特に古くない場合は、実際にはこの仕様を超える可能性があります。アレイに冗長性があり、それを修正できる場合、UREは問題にならない可能性があります。または、アレイが返す不良セクターは1つだけです。ファイルシステムはとにかく使用しませんでした。または重要でないファイルにヒットした場合。アレイが完全に失敗する場合は、はるかに問題があります。

参考文献:

実際には、目標復旧時点で必要な頻度で、アレイの外部に常にバックアップを用意してください。アレイの冗長性は、ドライブ障害からの回復時間を短縮することであり、すべてのデータ損失シナリオからユーザーを保護するわけではありません。

0
John Mahowald