web-dev-qa-db-ja.com

ディスクは死にかけていますか? iostatの不思議数

私の家にはこの古いP4ボックスがあり、UbuntuServerがメディアサーバーとして使用されています。

IDEブートドライブとは別に、これらのel-cheapo IDEのようなSATAアダプタに接続された1TBSATAディスクがあります これ

ディスクは、5400RPMで回転すると私が思うそれらの「緑」のものの1つであると思われます。

しばらくの間はそれほど不安定ではありませんでしたが、現在(約70%がいっぱいです)、最近、メディアレンダラーでメディアファイルを再生するときに問題が発生し始めました(常にではありませんが)。当初、私はそれが私のくだらないWiFiの再生だと思っていました。

しかし、それから私はiostatを実行し、いくつかの奇妙な数字を思いつきます。 (ところで、これらの数値は、Twonkymediaサーバーがディスクにインデックスを付けようとしているときのものです)

Iostat -dkx2の典型的な結果を次に示します。

Device: rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
sdb       0.00     0.00    0.00    0.00     0.00     0.00     0.00     2.00    0.00   0.00 100.00

Device: rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
sdb       0.00     0.00    0.00    0.00     0.00     0.00     0.00     1.99    0.00   0.00  99.50

...そのように続けて...そして:

Device: rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
sdb       0.00     0.00    0.50    0.00    64.00     0.00   256.00     1.58 206436.00 2000.00 100.00

ディスクが死んでいますか?


OK、smartctl -a/dev/sdbを実行すると、結果は次のようになります。

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD10EADS-00M2B0
Serial Number:    WD-WCAV50522614
Firmware Version: 01.00A01
User Capacity:    1,000,204,886,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sun Feb  7 07:43:21 2010 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                                        was suspended by an interrupting command from Host.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 (20760) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 239) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x303f) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   167   167   051    Pre-fail  Always       -       910436
  3 Spin_Up_Time            0x0027   134   110   021    Pre-fail  Always       -       6283
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       158
  5 Reallocated_Sector_Ct   0x0033   159   159   140    Pre-fail  Always       -       322
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2625
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       151
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       34
193 Load_Cycle_Count        0x0032   176   176   000    Old_age   Always       -       72261
194 Temperature_Celsius     0x0022   112   088   000    Old_age   Always       -       35
196 Reallocated_Event_Count 0x0032   001   001   000    Old_age   Always       -       320
197 Current_Pending_Sector  0x0032   192   192   000    Old_age   Always       -       1388
198 Offline_Uncorrectable   0x0030   200   199   000    Old_age   Offline      -       22
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   001   001   000    Old_age   Offline      -       125532

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

次に、ショートテストとコンベヤーテストの2つのテストを実行します。出力は次のとおりです。

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Conveyance offline  Completed: read failure       90%      2625         1070661197
# 2  Short offline       Completed: read failure       90%      2625         1070661197

OK、それで、興味のある人のために:ディスクは死にかけていました。

まず、これは古いボックスであり、IDE接続へのSATAが1つしかないため、ディスクを取り出して、メインデスクトップをSATAディスク間の転送マシンとして使用する必要がありました。 。

GPartedを実行して、パーティションを新しいディスクにコピーしようとしました。しかし、デフォルトでは、コピーする前にfsckを実行し、永久にかかりました。また、-Cオプションを指定すると実行されないため、2時間後、どこにあるのか、何をしているのか、どれだけ長く続いているのかがわかりませんでした。取るのでキャンセルしました。

次に、UbuntuデスクトップをLiveCDとして起動し、fsckを実行して、データを転送する前にできることをクリーンアップしようとしました。繰り返しになりますが、非常に長い時間がかかりましたが、プログレスバーはそれが進行していることをある程度保証してくれました。時々、ディスクをスラッシングすることは、劣化したディスクに良いよりも多くのダメージを与えているように感じましたが。

Fsckが終了したとき、私はファイルを1つのコピーにコピーしようとしましたが、それも永遠にかかりました。 iostatを実行して転送速度を確認したところ、平均で40kB/sであり、待機時間は10,000ミリ秒から60,000ミリ秒の間でした。

2時間後、iostatを実行し、同時にディスクから複数のコピー操作を開始しました。それはうまくいきましたが、恒星ではありませんでした。現在、平均転送速度は100〜600kB/sの間で変動していました。

この時点で、約800GBのデータを転送する必要があるため、転送には10〜20日の操作が必要であることが明らかになりました。

最新のデータのみを転送しましたが、約16時間かかりました。その時点で、サーバーが再び利用可能になる必要性(メインデスクトップは言うまでもなく)が、すべてのデータを回復する必要性よりも大きくなりました。

そこで、新しいディスクを箱に入れて、転送速度がとにかく遅いので、古いディスクをメインデスクトップに接続して、WiFi経由で管理できる他のデータを転送しようと決めました。

Windowsを実行しているため、問題がメインデスクトップになり、データにアクセスするためにExt2FSDをインストールしましたが、ディスクを接続すると、起動がまったく拒否されました。CDチェック後にフリーズしました。 Windowsの実行中にホットプラグを試してみましたが、表示されませんでした。

したがって、この時点で、主に何も必要とされないSATAコネクタを備えた別のマシンが利用可能になるのを待ってから、ディスクが使用できなくなる前に、可能な限りのデータを取得し、ネットワーク経由で転送しようとします。

以上で、今後の参考のためにみんなに知らせたいと思いました。

最初の回答にチェックマークを付けるために、回答ではなく、質問の付録として最終ステータスを投稿します。

提案してくれてありがとう。

2
user34039

「しゃっくり」とはどういう意味ですか?それは音ですか、それとも行動ですか?

SMARTユーティリティを使用してディスクレベルの診断を調べ、何が起こっているかを確認します。そこに多くの読み取りエラーがある場合、またはディスクが停止していることを示すその他の兆候がある場合は、そこに表示されます。 。

WDの「グリーン」ドライブについて話している場合、ところで、それらに関係する電力は低いだけではありません。彼らは別のフォーマットを使用することさえあります。これはWindowsには問題ありませんが、他のOSにはほとんど(一度実行すると)うまくいきません。

1
Michael Graff