web-dev-qa-db-ja.com

これはSMARTセルフテストはドライブの障害を示していますか?

このSMARTセルフテストの結果がドライブの障害を示しているかどうか疑問に思っています。これは、結果に「completed:read failure」が表示される唯一のドライブです。

# smartctl -l selftest /dev/sde
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)   LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%      8981         976642822
# 2  Extended offline    Aborted by Host               90%      8981         -
# 3  Extended offline    Completed: read failure       90%      8981         976642822
# 4  Extended offline    Interrupted (Host reset)      90%      8977         -
# 5  Extended offline    Completed without error       00%       410         -

ドライブは、SMARTセルフテストの出力を除いて、まだ障害の兆候を示していません。これは、現在SMARTセルフテストを実行している同じシステムの別のドライブからの出力です

# smartctl -l selftest /dev/sdc
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Self-test routine in progress 30%     15859         -
# 2  Extended offline    Completed without error       00%      9431         -
# 3  Extended offline    Completed without error       00%      8368         -


SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       1
  3 Spin_Up_Time            0x0027   176   175   021    Pre-fail  Always       -       4183
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       48
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   088   088   000    Old_age   Always       -       8982
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       46
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       34
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       13
194 Temperature_Celsius     0x0022   111   101   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       2
10
Jeff Welling

うまくいけば、ドライブを交換してから長い間ですが、誰もまだ直接質問に答えていないので...

2つのテストを実行しましたが、どちらのテストでも、Completed: read failureと同じLBAで示されているように、どちらもディスクの同じ論理セクターの読み取りに失敗しました。これは確かにディスクに欠陥があることを示しており、保証のもとで交換することができるはずです。このセクターにデータを保存しようとすると、ドライブが書き込みプロセス中に欠陥を認識してセクターを再マップする場合とそうでない場合がありますが、ドライブが認識せず、後でデータを読み取れない場合は、データが失われています。それ。

8
Michael Hampton

あなたのデータは疑わしいドライブでリスクを冒す価値がありますか?

それが私だったら、ドライブを交換して、SMART=で大きな頭痛の種を節約できたことに感謝します。

4
Bacon Bits

他の回答のコメントに追加したいのですが、担当者がいないためできません。

Cronスクリプトを作成する必要はありません。smartmontoolsパッケージには smartdデーモン があり、実行したいことだけを処理します。定期的なSMART statusのチェック必要なのは 構成を作成 してサービスを開始することですsmartmontoolsパッケージには、何かが失敗したときにsmartdが呼び出すことができるいくつかのサンプルスクリプトも含まれています。

4
Sgaduuw

あなたの状況で私は何をしますか?

まず、影響を受けるファイルを見つけます。これを行うにはいくつかの指示があります http://smartmontools.sourceforge.net/badblockhowto.html#e2_example1 ええ。あなたの場合、配列があるので難しいです。しかし、それは可能です。障害のあるセクターにゼロを書き込むよりも、このファイルがバックアップされていることを確認してください。 2つのことが起こります。 1.ドライブはこのセクターにゼロを正常に書き込みます。 Current_Pending_Sector、Reallocated_Sector_Ctは後でゼロにする必要があります。 2.ドライブはこのセクターへの書き込みに失敗します。それはこのセクターを「予備の」エリアに再マッピングします。

いずれの場合も、最終的には固定ドライブになります。バックアップからファイルを復元する必要があります(ファイルの1つのセクターを上書きしたため)。また、拡張セルフテストを再実行して、エラーが発生していないことを確認する必要があります。

健康を維持する!

追伸この投稿は少し古いことを知っています。しかし、私はそれをグーグルしました。そして、私は別の良い答えを提供することは良い考えだと思います。

2

ドライブはおそらく途中でした。ドライブの一部から読み取ることができないことは、間違いなく障害状態であり、他の典型的なディスク障害の兆候なしにそれが起こることは確かに可能です。この種のことは一般的に一時的なものではありません。他の兆候がない場合、それは弱いヘッド、非常にわずかな位置合わせの問題、またはプラッター(シリンダー?)の欠陥領域である可能性があります。

もう1つの方法は、SMARTバグがあったことです。バグのあるファームウェアでドライブを実行したくないのです。

SMARTでエラーが発生した場合は常に、データの損失を防ぐために新しいドライブを入手する必要があることを強く示しています。一部は早期警告システムとして意図されています。

0
Falcon Momot
  • できるだけ早くバックアップしてください!

  • このドライブがまだ保証期間内である場合、

    • ベンダーのチェックユーティリティを実行します(通常、ブートCDを取得できます)
    • これがエラーを返す場合は、ビンゴし、それを送り返し、交換を待つ
    • バックアップから復元
    • 問題解決-終了

  • このドライブに保証がない場合は、ねじ込まれています
    • まだ希望はあります...
    • これは実際には読み取りエラーであるため、書き込みができないという意味ではありません
    • バックアップを作成した後、実際に読み込める新しいデータで読み取り不可能なセクターを上書きするため、バックアップの復元を試みることができます(通常、これはバックグラウンドで機能し、ほとんどの場合、ドライブはこれらのブロックをスペアセクターに再マッピングします)
    • badblocksツールもこれに使用できます(すでにバックアップがありますよね?)
      • これを実際に使用してディスクをテストすることはせず(決してディスクを使用しても意味がありません)、これらのセクターに複数回書き込む
    • もう一度スマートテストを再実行すると、これらの読み取り不可能なセクターが「自分自身を修正」する可能性があります
    • 問題は解決していません。ドライブの寿命を延ばしただけです。おそらく、使用状況によっては通常よりも早く故障する可能性がありますが、ディスクは安価です。データが重要な場合は新しいディスクを入手してください-終了
0
cstamas