web-dev-qa-db-ja.com

SMART SASディスクのデータを解釈するにはどうすればよいですか?

障害のあるSATAディスクの一部を新しいSASディスクに交換中です。障害のあるディスクの1つが含まれているRAIDアレイは、再シルバー化の過程にあります。それが進むにつれて、次のことができます。新しいディスクの書き込みエラー訂正率をゆっくりと、しかし着実に増加させてください。これは、SASハードウェアへの私の最初の露出であり、私は大きなものに慣れているので、smartctl出力に慣れていません。 SATAディスクが生成するテーブル。

ディスクはHGSTUltrastar 2TBであり、IBM M1015HBAを介してパススルーモードで接続されています。

以下のSMARTデータをどの程度正確に解釈する必要がありますか?修正されたエラー率の上昇が心配ですか?修正アルゴリズムの呼び出しフィールドはどうですか?

  Device: HITACHI  HUS723020ALS640  Version: A222
Serial number:         xxxxxxxx
Device type: disk
Transport protocol: SAS
Local Time is: Thu Jul 11 15:42:30 2013 MDT
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK

Current Drive Temperature:     44 C
Drive Trip Temperature:        85 C
Manufactured in week 29 of year 2012
Recommended maximum start stop count:  50000 times
Current start stop count:      2 times
Elements in grown defect list: 0
Vendor (Seagate) cache information
  Blocks sent to initiator = 149833037905920

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          6          0.565           0
write:         0      400         0       400         51       1034.246           0
verify:        0        0         0         0         37          0.000           0

Non-medium error count:        0
4
Jeff Shattock

遅延エラーは、他の要求を遅くするエラーです。 ECC/SASドライブでは、ECCで修正されたエラーはそれほど心配する必要はありません。ドライブには何億ものドライブが展開されていますが、それでも正常に動作します。修正アルゴリズムの呼び出しはもう少し深刻です。ディスクの再読み取り/再書き込み、およびECC計算の再試行が必要になる場合があります。

エラーの数が気になるかどうかはわかりません。標準は1つではなく、メーカーごとに独自のものがあり、独自の基準を維持しています。通常、メーカーのWebサイトからユーティリティをダウンロードして、追加情報を入手できます。

Hitachiの場合、リンクは次のとおりです。 http://www.hgst.com/support/downloads#WINDFT

さまざまなエラーの詳細については、こちらをご覧ください: http://smartmontools.sourceforge.net/smartmontools_scsi.html

4
Gregg A.