最近、「オフラインの修正不可能なセクター」がSMARTステータスで表示された2ディスクソフトウェアRAID-1のディスクがあります。
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
これは、ディスク障害がますます頻繁に発生する場合、差し迫ったディスク障害の兆候にすぎないようです(また、ドライブがミラーリングされているため、実際のデータ損失の大きなリスクもありません)。当時、セルフテストもある時点で失敗し、smartd
からメールが届きました。もちろんそうする必要があります。
ただし、損傷したセクターに書き込むと、通常、ディスクはスペアセクターの1つを使用します。これは、ディスクをdd
したため、すべてのセルフテストが正常に実行されたためです。そして、badblocks
も文句を言う理由を見つけませんでした。
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
障害のあるセクターの数は減少しませんでしたが、実際には、壊れたセクターは未使用ではありますが、まだそこにあるため、減少するはずはありません。ただし、smartd
は毎晩メールを送信し続けます。
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
これは明らかに非常に迷惑であり、私の健康的なパニック反射をsmartd
メールに麻痺させます。
ディスクはWestern Digital WD20EARSであり、smartd
バージョンは5.41 2011-06-09 r3365です。
一部のディスクでは、構成ファイルで-U 198+
(または-U +
?)を使用する必要がある場合があります。
お気をつけください。元の質問者でない場合は、質問全体を注意深く読んでください。これを必要としないディスクで使用すると、完全に有効な警告が抑制されます。
´+´が指定されている場合、最後のチェックサイクル以降にセクター数が増加した場合にのみレポートが出力されます。一部のディスクは、不良セクタが再割り当てされたときにこの属性をリセットしません。以下の「-v198、増加」も参照してください。
たとえば、smartd.conf
でデフォルト設定を使用しているとします。その場合、ファイルには多くのコメントがありますが、コメント以外の行は次のとおりです。
# The Word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices. DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found. Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN
行末にオプションを追加します。
DEVICESCAN -U 198+
これらのメールの送信元には2つの可能性があります。 smartdはそれ自体でメールを送信できますが、このように構成されていない可能性が高いため、これらのメールはlogcheckによって送信されると思います。この仮定が間違っている場合は、これ以上読む必要はありません。
logcheckはログファイルをスキャンし、システムで発生した/システムで発生した問題について心配する必要があると判断した場合にメールを送信します。
特定のパターンに一致するメッセージを送信しないようにlogcheckに指示するlogcheck無視ルールを作成するオプションがあります。
(Debianベースのシステムでは)次の内容の「/etc/logcheck/ignore.d.server/smartd_own」というファイルを作成できます。
^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$
これにより、迷惑メールは除外されますが、修正不可能なセクターカウンターが増加した場合は、再度連絡してください。