RAID 1ミラーの一部であるドライブに2つの不良ブロックがあります。 Adaptec Storage Mangerは、ブロックを検出したときに私に電子メールを送信しました。そのドライブに対して4つの中程度のエラーが表示されますが、状態は依然として「最適」です。
AdaptecRAIDコントローラーを使用するのはこれが初めてです。たまに悪いブロックが正常なのか、それともすぐにそのドライブを交換する必要があるのかわかりません。
更新:ドライブは同じ日に故障しました!
ディスクサブシステムは次のとおりです。
他のドライブはまだ不良ブロックを報告していません。整合性チェックを実行しています。
私は通常、自分の質問に答えることはありませんが、この場合、明確な答えがあります。ドライブをできるだけ早く交換してください。問題のドライブは同じ日に故障しました。
午前の早い時間に、次のような3通の電子メールを受け取りました。これが、ドライブに不良ブロックがあることを私が知った方法であり、唯一の警告でした。
======================================================================================
ADAPTEC's EMAIL NOTIFICATION MANAGER (Instant)
======================================================================================
Event Type : Warning
Event Source : [email protected]
Date : 06/29/2011
Time : 05:29:03 AM PDT
--------------------------------------------------------------------------------------
Event(s) List With Description
--------------------------------------------------------------------------------------
Bad Block discovered: controller 1 (21a6e00).
--------------------------------------------------------------------------------------
**[Note]: This message was generated by the Adaptec Storage Manager Agent.
Please do not reply to this message.
その日の終わりまでに、それは失敗しました。
ドライブがアレイで使用されている場合、コントローラーはTime Limited ErrorRecoveryを設定します。これにより、ディスクがデータをすぐに読み取れない場合、ディスクは中程度のエラーを報告します。これは、読み取りエラーから回復しないことや、セクターが完全に読み取れないことを意味するものではありません。
(安価なSATAドライブはTLERをサポートしておらず、ドライブがデータを回復しようとしている間、読み取り操作がハングします。これは、安価なSATAドライブをアレイでバスに接続してはならない多くの理由の1つにすぎません。もちろんこれは当てはまりません。この特定の質問に)
セクターが読み取り不能であるとディスクが判断した場合、ディスクはセクターを再マップします。元の不良セクタはチェーンの上位に報告されないため、OSで実行されているソフトウェアはそれを知る方法がありません。できる唯一のことは、SMARTレポートを検索して、再マップされたセクターの数を確認することです。再マップされている多くのセクターは、今後の悪いことを示す良い兆候です。SMARTは、ディスクでソフトエラーとハードエラーが発生した回数も報告する場合があります。
いずれにせよ、SMART故障前の予測は役に立たなかった; Google SMART Study はそれを裏付ける。
大型ドライブには不良セクタを移動するための余分なスペースがたくさんあります。2週間の間に数百のセクタが交換され、その後ドライブをさらに1か月間使用し続けました(RAID6なので、ラッシュはしませんでした)。
交換されたセクターがさらにいくつかあることを毎日警告し続ける場合は、失敗する前に交換します。ドライブを最初に使用したときの不良セクタのバーストはまったく怖いものではありませんが、継続的な状態は通常、エンクロージャ内の粒子または読み取り/書き込みヘッドの損傷を意味します。
私はSASドライブを使用していませんが、通常のSCSIドライブとIDEドライブがいくつかの不良ブロックを取得し、他の問題なしで何年も動作します。S.M.A.R.T.ステータスは、ドライブが低下し、障害が発生するリスクがあることを示します。
また、RAID 0以外のRAIDを使用している限り、障害が発生した場合でも保護されます。