最近、お客様のサイトのバックアップサーバーのHDDをより大きなものに交換しました。 HP SE326M1 *上で動作するそのfreenasボックス。
ZFSがドライブを交換しているときに、大規模な停電が発生しました。
大きな問題ではありませんでした-ボックスが再び始まり、リシルバーも。
今日、私は何か面白いものを見つけました。別のドライブも再シルバー化ステータスを取得しました。ただし、zpool status -v
には読み取り/書き込み/ cksumエラーはありません。
pool: Tank
state: ONLINE
status: One or more devices is currently being resilvered. The pool will
continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
scan: resilver in progress since Sat Mar 4 15:37:53 2017
3.41T scanned out of 4.51T at 24.7M/s, 13h3m to go
302G resilvered, 75.43% done
config:
NAME STATE READ WRITE CKSUM
Tank ONLINE 0 0 0
raidz2-0 ONLINE 0 0 0
gptid/ad81fb87-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
gptid/b30f664d-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
gptid/09b6b651-ff29-11e6-9a6a-d8d385e6539a ONLINE 0 0 0 (resilvering) <-- drive was replaced
gptid/beb62f74-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
gptid/c2c97ff3-96b5-11e6-af9c-d8d385e6539a ONLINE 0 0 0
raidz2-1 ONLINE 0 0 0
gptid/41b1a629-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
gptid/4756cd8e-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
gptid/508e74c7-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
gptid/575939b3-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0 (resilvering) <-- drive in question
gptid/5d914967-9785-11e6-894c-d8d385e6539a ONLINE 0 0 0
errors: No known data errors
ステータス「(resilvering)」は、最初のドライブのresilverが進行中である間、過去数時間に表示されました。
2番目のドライブも再シルバー化されている理由を特定する方法はありますか? gptid/575939b3-9785-11e6-894c-d8d385e6539a
に表示されるエラーに関係なく、ZFSがzpool status
にresilverステータスを表示するのはなぜですか?
-
* HP-Serverには、書き込みスルーモードのP410レイドコントローラーがあります。すべてのドライブは独自のRAID-0として構成されています
それは再び起こりました、そして今度は私はログを持っています。 user121391は完全に正しく、問題のドライブに「再試行不能」エラーがあったことが判明しました。
Mar 12 08:22:14 freenas ciss0: *** Fatal drive error, Port=1I Box=1 Bay=14
Mar 12 08:22:14 freenas ciss0: (da9:ciss0:0:9:0): READ(10). CDB: 28 00 1b 50 ff 98 00 00 08 00
Mar 12 08:22:14 freenas FATAL I/O ERROR on logical drive 9 (), SCSI port 0 ID 21
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): CAM status: SCSI Status Error
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI status: Check Condition
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI sense: MEDIUM ERROR asc:11,0 (Unrecovered read error)
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): Error 5, Unretryable error
このエラーの後、RAIDコントローラーがドライブを再接続し、これが再シルバーをトリガーしたようです。