web-dev-qa-db-ja.com

再割り当てセクター数の多いディスクを使用する方法

24時間年中無休のサービスで3年間使用した後、1TBのSeagate Barracuda ES.2エンタープライズドライブが故障の兆候を示しています。 S.M.A.R.T.再割り当てセクター数が多い。

ウィキペディア 記事 は、再マップされたセクターが未使用のままになっている場合、ドライブをアレイ外のスクラッチストレージなどの感度の低い目的に引き続き使用できることを示唆しています。

A workaround which will preserve drive speed at the expense of capacity 
is to create a disk partition over the region which contains remaps and 
instruct the operating system to not use that partition.

このようなパーティションを作成するには、再マップされたセクターのリストをフェッチする必要があります。ただし、オペレーティングシステムに表示される不良ブロックはありません。つまりbadblocksは空のリストを返します。

再割り当てされたセクターのリストを復元する方法はありますか?

編集:このドライブはアレイからのものです。それらのいくつかは毎年失敗し、それらを捨てるだけでは無駄のようです。プラッターのより良い部分にもう一度チャンスを与えることを考えています。

S.M.A.R.T.レポートの外観を次に示します。

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda ES.2
Device Model:     ST31000340NS
Serial Number:    **********
Firmware Version: SN05
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   056   054   044    Pre-fail  Always       -       164293299
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       14
  5 Reallocated_Sector_Ct   0x0033   005   005   036    Pre-fail  Always   FAILING_NOW 1955
  7 Seek_Error_Rate         0x000f   076   060   030    Pre-fail  Always       -       8677183434
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       24893
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   037   020    Old_age   Always       -       14
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   097   097   000    Old_age   Always       -       3
190 Airflow_Temperature_Cel 0x0022   050   043   045    Old_age   Always   In_the_past 50 (0 6 50 32)
194 Temperature_Celsius     0x0022   050   057   000    Old_age   Always       -       50 (0 18 0 0)
195 Hardware_ECC_Recovered  0x001a   021   010   000    Old_age   Always       -       164293299
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       21
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       21
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
7
Dmitri Chubarov

あなたはしません。

本当にデータを失いたくない場合を除いて、別のディスクを購入して交換します。

16
SpacemanSpiff

アドバイスに感謝し、実験から得た詳細のいくつかを共有したいと思います。

要するに、再割り当てされたセクターのリストを取得する簡単な方法はなく、ディスクをマッピングする統計的な方法でさえ、ファームウェアのロジックと対抗する必要があるため、大きな障害になっています。

ドライブをテストするために私は走ったbadblocks -wvデフォルトのブロックサイズで、プロセスで再割り当てされたセクター数を監視しました。私はいくつかの観察をしました。

  1. ディスクの先頭に書き込むときに、再割り当てされたセクターの数が急激に増加しているのがわかりました。その後、最初の10Gから700Gに変更はありませんでした。これは、特定のRAIDハウスキーピングデータがディスクの最初に格納されたため、小さなアドレス領域の摩耗がディスクの他の部分よりも高かったという事実で説明できます。

  2. その後、単一のエラーの後、ディスクはブロックモードに変わりました。これは、IDENTIFY DRIVEABRTを返しました。再割り当てされたセクターの価値はまだプラスでしたが。この動作をDavid Schwartzが示すように説明するために、予約されたセクターがドライブのアドレス空間全体に分散されていると想定しました。これは、ドライブに予約済みセクターがある可能性があることを意味しますが、その一部はセクターを使い果たして再マップすることがあります。この状況では、ファームウェアはドライブをブロックするだけです。

  3. ドライブの電源を入れ直した後にのみ、ドライブはブロックモードから復帰します。古いドライブがソフトウェアに不良ブロックを追跡させ、それらの使用を回避する場合、最新のドライブはこの機会を与えません。ファームウェアがエラーに対処できないと判断すると、ドライブが使用できなくなります。

  4. 再割り当てされたセクターの値を02まで実行すると、このドライブには2048個の予約済みセクターがあることがわかります。

  5. いわゆる低レベルのフォーマット、またはドライブのすべてのアクセス可能なセクターにゼロを書き込んでディスクの信頼性の低い部分からセクターを再割り当てすると、ドライブが予約済みセクターを使い果たすと、エラーの処理方法が変わるため、機能しません。そのため、予測的な障害分析を行わず、エラーを報告するだけの従来のドライブよりも、使い勝手が大幅に低下します。

12
Dmitri Chubarov

ドライブがまだ保証期間中の場合は、最初にサニタイズした後、RMAプロセスを介してメーカーに返品し、無料で交換できます。 (Secure Eraseは、再割り当てされたセクターやアクセスできないセクターを含む、ドライブ全体をワイプします。)(だれもこれを提案しなかったことに私はかなり驚いています。)そうでなければ、@ SpacemanSpiffが言ったことを実行して、新しいドライブを購入します。

3
Michael Hampton

ドライブのコストよりも価値のあるビジネスデータがある場合は、そのデータを使用してください。そうでない場合は、破棄するか、リスクを理解している部門の人に渡してください。製造元に連絡して、リサイクルできるかどうかを確認してください。

3
user9517

私はそのような多くのドライブを持っていました、それが不良セクターのほとんどがそこにあり、ドライブ容量から5-10%を取る場合は、開始位置を変更した後メーカーのツールでllfします。まともなコントローラとソフトウェアの場合、割り当てられていないものをスペアとして使用します。コントローラが不良な電源装置によってトーチされるまで、問題なく5年間WD 1800を160 GBまで削減しました。私は現在、TVキャップに同様にSamsungを使用しており、2 TBの100 GBを削除しました。トランスポートストリームのエラーは、ドライブが導入するよりも多くなるため、しばらく問題にはなりません。

Hitachi、Samsung、WD llfツールは再マッピングに優れた機能を発揮するようですが、Seagateは使用されなくなったか、致命的な障害が発生したため、まだわかりません。

*これらのことを行うのは、究極のブートディスクを使用することで、はるかに簡単になりました。

1
Ty2010

実際に拡張された安全な消去は、予約されたブロックもカバーするため、より優れています。

ただし、実際に不良セクタが多数ある場合、ディスクはペーパーウェイトです。それがそれらを再割り当てしないか、またはそれらを大丈夫と宣言しない場合、同上(保留中のセクターは、読み取りの問題がある場合に発生します。それらのほとんどは、通常、外部振動によって引き起こされる「ソフト」エラーです。)

1
Stoat