web-dev-qa-db-ja.com

ある特定のオフラインの修正不可能なセクターについてsmartdをシャットダウンさせる方法は?

最近、「オフラインの修正不可能なセクター」がSMARTステータスで表示された2ディスクソフトウェアRAID-1のディスクがあります。

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

これは、ディスク障害がますます頻繁に発生する場合、差し迫ったディスク障害の兆候にすぎないようです(また、ドライブがミラーリングされているため、実際のデータ損失の大きなリスクもありません)。当時、セルフテストもある時点で失敗し、smartdからメールが届きました。もちろんそうする必要があります。

ただし、損傷したセクターに書き込むと、通常、ディスクはスペアセクターの1つを使用します。これは、ディスクをddしたため、すべてのセルフテストが正常に実行されたためです。そして、badblocksも文句を言う理由を見つけませんでした。

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

障害のあるセクターの数は減少しませんでしたが、実際には、壊れたセクターは未使用ではありますが、まだそこにあるため、減少するはずはありません。ただし、smartdは毎晩メールを送信し続けます。

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

これは明らかに非常に迷惑であり、私の健康的なパニック反射をsmartdメールに麻痺させます。

ディスクはWestern Digital WD20EARSであり、smartdバージョンは5.41 2011-06-09 r3365です。

19
Christian

一部のディスクでは、構成ファイルで-U 198+(または-U +?)を使用する必要がある場合があります。

お気をつけください。元の質問者でない場合は、質問全体を注意深く読んでください。これを必要としないディスクで使用すると、完全に有効な警告が抑制されます。

´+´が指定されている場合、最後のチェックサイクル以降にセクター数が増加した場合にのみレポートが出力されます。一部のディスクは、不良セクタが再割り当てされたときにこの属性をリセットしません。以下の「-v198、増加」も参照してください。

smartd.conf(5)

たとえば、smartd.confでデフォルト設定を使用しているとします。その場合、ファイルには多くのコメントがありますが、コメント以外の行は次のとおりです。

# The Word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

行末にオプションを追加します。

DEVICESCAN -U 198+
24
sourcejedi

これらのメールの送信元には2つの可能性があります。 smartdはそれ自体でメールを送信できますが、このように構成されていない可能性が高いため、これらのメールはlogcheckによって送信されると思います。この仮定が間違っている場合は、これ以上読む必要はありません。

logcheckはログファイルをスキャンし、システムで発生した/システムで発生した問題について心配する必要があると判断した場合にメールを送信します。

特定のパターンに一致するメッセージを送信しないようにlogcheckに指示するlogcheck無視ルールを作成するオプションがあります。

(Debianベースのシステムでは)次の内容の「/etc/logcheck/ignore.d.server/smartd_own」というファイルを作成できます。

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

これにより、迷惑メールは除外されますが、修正不可能なセクターカウンターが増加した場合は、再度連絡してください。

0
hennr