24時間年中無休のサービスで3年間使用した後、1TBのSeagate Barracuda ES.2エンタープライズドライブが故障の兆候を示しています。 S.M.A.R.T.再割り当てセクター数が多い。
ウィキペディア 記事 は、再マップされたセクターが未使用のままになっている場合、ドライブをアレイ外のスクラッチストレージなどの感度の低い目的に引き続き使用できることを示唆しています。
A workaround which will preserve drive speed at the expense of capacity
is to create a disk partition over the region which contains remaps and
instruct the operating system to not use that partition.
このようなパーティションを作成するには、再マップされたセクターのリストをフェッチする必要があります。ただし、オペレーティングシステムに表示される不良ブロックはありません。つまりbadblocks
は空のリストを返します。
再割り当てされたセクターのリストを復元する方法はありますか?
編集:このドライブはアレイからのものです。それらのいくつかは毎年失敗し、それらを捨てるだけでは無駄のようです。プラッターのより良い部分にもう一度チャンスを与えることを考えています。
S.M.A.R.T.レポートの外観を次に示します。
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda ES.2
Device Model: ST31000340NS
Serial Number: **********
Firmware Version: SN05
...
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 056 054 044 Pre-fail Always - 164293299
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 14
5 Reallocated_Sector_Ct 0x0033 005 005 036 Pre-fail Always FAILING_NOW 1955
7 Seek_Error_Rate 0x000f 076 060 030 Pre-fail Always - 8677183434
9 Power_On_Hours 0x0032 072 072 000 Old_age Always - 24893
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 14
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 097 097 000 Old_age Always - 3
190 Airflow_Temperature_Cel 0x0022 050 043 045 Old_age Always In_the_past 50 (0 6 50 32)
194 Temperature_Celsius 0x0022 050 057 000 Old_age Always - 50 (0 18 0 0)
195 Hardware_ECC_Recovered 0x001a 021 010 000 Old_age Always - 164293299
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 21
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 21
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
あなたはしません。
本当にデータを失いたくない場合を除いて、別のディスクを購入して交換します。
アドバイスに感謝し、実験から得た詳細のいくつかを共有したいと思います。
要するに、再割り当てされたセクターのリストを取得する簡単な方法はなく、ディスクをマッピングする統計的な方法でさえ、ファームウェアのロジックと対抗する必要があるため、大きな障害になっています。
ドライブをテストするために私は走ったbadblocks -wv
デフォルトのブロックサイズで、プロセスで再割り当てされたセクター数を監視しました。私はいくつかの観察をしました。
ディスクの先頭に書き込むときに、再割り当てされたセクターの数が急激に増加しているのがわかりました。その後、最初の10Gから700Gに変更はありませんでした。これは、特定のRAIDハウスキーピングデータがディスクの最初に格納されたため、小さなアドレス領域の摩耗がディスクの他の部分よりも高かったという事実で説明できます。
その後、単一のエラーの後、ディスクはブロックモードに変わりました。これは、IDENTIFY DRIVE
はABRT
を返しました。再割り当てされたセクターの価値はまだプラスでしたが。この動作をDavid Schwartzが示すように説明するために、予約されたセクターがドライブのアドレス空間全体に分散されていると想定しました。これは、ドライブに予約済みセクターがある可能性があることを意味しますが、その一部はセクターを使い果たして再マップすることがあります。この状況では、ファームウェアはドライブをブロックするだけです。
ドライブの電源を入れ直した後にのみ、ドライブはブロックモードから復帰します。古いドライブがソフトウェアに不良ブロックを追跡させ、それらの使用を回避する場合、最新のドライブはこの機会を与えません。ファームウェアがエラーに対処できないと判断すると、ドライブが使用できなくなります。
再割り当てされたセクターの値を02まで実行すると、このドライブには2048個の予約済みセクターがあることがわかります。
いわゆる低レベルのフォーマット、またはドライブのすべてのアクセス可能なセクターにゼロを書き込んでディスクの信頼性の低い部分からセクターを再割り当てすると、ドライブが予約済みセクターを使い果たすと、エラーの処理方法が変わるため、機能しません。そのため、予測的な障害分析を行わず、エラーを報告するだけの従来のドライブよりも、使い勝手が大幅に低下します。
ドライブがまだ保証期間中の場合は、最初にサニタイズした後、RMAプロセスを介してメーカーに返品し、無料で交換できます。 (Secure Eraseは、再割り当てされたセクターやアクセスできないセクターを含む、ドライブ全体をワイプします。)(だれもこれを提案しなかったことに私はかなり驚いています。)そうでなければ、@ SpacemanSpiffが言ったことを実行して、新しいドライブを購入します。
ドライブのコストよりも価値のあるビジネスデータがある場合は、そのデータを使用してください。そうでない場合は、破棄するか、リスクを理解している部門の人に渡してください。製造元に連絡して、リサイクルできるかどうかを確認してください。
私はそのような多くのドライブを持っていました、それが不良セクターのほとんどがそこにあり、ドライブ容量から5-10%を取る場合は、開始位置を変更した後メーカーのツールでllfします。まともなコントローラとソフトウェアの場合、割り当てられていないものをスペアとして使用します。コントローラが不良な電源装置によってトーチされるまで、問題なく5年間WD 1800を160 GBまで削減しました。私は現在、TVキャップに同様にSamsungを使用しており、2 TBの100 GBを削除しました。トランスポートストリームのエラーは、ドライブが導入するよりも多くなるため、しばらく問題にはなりません。
Hitachi、Samsung、WD llfツールは再マッピングに優れた機能を発揮するようですが、Seagateは使用されなくなったか、致命的な障害が発生したため、まだわかりません。
*これらのことを行うのは、究極のブートディスクを使用することで、はるかに簡単になりました。
実際に拡張された安全な消去は、予約されたブロックもカバーするため、より優れています。
ただし、実際に不良セクタが多数ある場合、ディスクはペーパーウェイトです。それがそれらを再割り当てしないか、またはそれらを大丈夫と宣言しない場合、同上(保留中のセクターは、読み取りの問題がある場合に発生します。それらのほとんどは、通常、外部振動によって引き起こされる「ソフト」エラーです。)