失敗したソフトウェアRAID5セットアップを回復するための最善の試みを行うには、どのような手順を実行する必要がありますか？

Question

私の襲撃は失敗しました、そしてそれを回復するために最善の試みをするために取るべき最善のステップが何であるかわかりません。

RAID5構成で4台のドライブがあります。失敗したように見えますが（sde1）、sdd1は新鮮ではないと表示されているため、mdは配列を起動できません。

アレイを回復するためにできることはありますか？

/var/log/messagesとmdadm --examineからの抜粋を以下に貼り付けました。

/var/log/messages

$ egrep -w sd[b,c,d,e]\|raid\|md /var/log/messages

nas kernel: [...] sd 5:0:0:0: [sde] nas kernel: [...] sd 5:0:0:0: [sde] CDB: nas kernel: [...] end_request: I/O error, dev sde, sector 937821218 nas kernel: [...] sd 5:0:0:0: [sde] killing request nas kernel: [...] md/raid:md0: read error not correctable (sector 937821184 on sde1). nas kernel: [...] md/raid:md0: Disk failure on sde1, disabling device. nas kernel: [...] md/raid:md0: Operation continuing on 2 devices. nas kernel: [...] md/raid:md0: read error not correctable (sector 937821256 on sde1). nas kernel: [...] sd 5:0:0:0: [sde] Unhandled error code nas kernel: [...] sd 5:0:0:0: [sde] nas kernel: [...] sd 5:0:0:0: [sde] CDB: nas kernel: [...] end_request: I/O error, dev sde, sector 937820194 nas kernel: [...] sd 5:0:0:0: [sde] Synchronizing SCSI cache nas kernel: [...] sd 5:0:0:0: [sde] nas kernel: [...] sd 5:0:0:0: [sde] Stopping disk nas kernel: [...] sd 5:0:0:0: [sde] START_STOP FAILED nas kernel: [...] sd 5:0:0:0: [sde] nas kernel: [...] md: unbind<sde1> nas kernel: [...] md: export_rdev(sde1) nas kernel: [...] md: bind<sdd1> nas kernel: [...] md: bind<sdc1> nas kernel: [...] md: bind<sdb1> nas kernel: [...] md: bind<sde1> nas kernel: [...] md: kicking non-fresh sde1 from array! nas kernel: [...] md: unbind<sde1> nas kernel: [...] md: export_rdev(sde1) nas kernel: [...] md: kicking non-fresh sdd1 from array! nas kernel: [...] md: unbind<sdd1> nas kernel: [...] md: export_rdev(sdd1) nas kernel: [...] md: raid6 personality registered for level 6 nas kernel: [...] md: raid5 personality registered for level 5 nas kernel: [...] md: raid4 personality registered for level 4 nas kernel: [...] md/raid:md0: device sdb1 operational as raid disk 2 nas kernel: [...] md/raid:md0: device sdc1 operational as raid disk 0 nas kernel: [...] md/raid:md0: allocated 4338kB nas kernel: [...] md/raid:md0: not enough operational devices (2/4 failed) nas kernel: [...] md/raid:md0: failed to run raid set. nas kernel: [...] md: pers->run() failed ...

mdadm --examine

$ mdadm --examine /dev/sd[bcdefghijklmn]1

/dev/sdb1: Magic : a92b4efc Version : 1.2 Feature Map : 0x0 Array UUID : 4dc53f9d:f0c55279:a9cb9592:a59607c9 Name : NAS:0 Creation Time : Sun Sep 11 02:37:59 2011 Raid Level : raid5 Raid Devices : 4 Avail Dev Size : 3907027053 (1863.02 GiB 2000.40 GB) Array Size : 5860538880 (5589.05 GiB 6001.19 GB) Used Dev Size : 3907025920 (1863.02 GiB 2000.40 GB) Data Offset : 2048 sectors Super Offset : 8 sectors State : clean Device UUID : e8369dbc:bf591efa:f0ccc359:9d164ec8 Update Time : Tue May 27 18:54:37 2014 Checksum : a17a88c0 - correct Events : 1026050 Layout : left-symmetric Chunk Size : 512K Device Role : Active device 2 Array State : A.A. ('A' == active, '.' == missing) /dev/sdc1: Magic : a92b4efc Version : 1.2 Feature Map : 0x0 Array UUID : 4dc53f9d:f0c55279:a9cb9592:a59607c9 Name : NAS:0 Creation Time : Sun Sep 11 02:37:59 2011 Raid Level : raid5 Raid Devices : 4 Avail Dev Size : 3907027053 (1863.02 GiB 2000.40 GB) Array Size : 5860538880 (5589.05 GiB 6001.19 GB) Used Dev Size : 3907025920 (1863.02 GiB 2000.40 GB) Data Offset : 2048 sectors Super Offset : 8 sectors State : clean Device UUID : 78221e11:02acc1c8:c4eb01bf:f0852cbe Update Time : Tue May 27 18:54:37 2014 Checksum : 1fbb54b8 - correct Events : 1026050 Layout : left-symmetric Chunk Size : 512K Device Role : Active device 0 Array State : A.A. ('A' == active, '.' == missing) /dev/sdd1: Magic : a92b4efc Version : 1.2 Feature Map : 0x0 Array UUID : 4dc53f9d:f0c55279:a9cb9592:a59607c9 Name : NAS:0 Creation Time : Sun Sep 11 02:37:59 2011 Raid Level : raid5 Raid Devices : 4 Avail Dev Size : 3907027053 (1863.02 GiB 2000.40 GB) Array Size : 5860538880 (5589.05 GiB 6001.19 GB) Used Dev Size : 3907025920 (1863.02 GiB 2000.40 GB) Data Offset : 2048 sectors Super Offset : 8 sectors State : clean Device UUID : fd282483:d2647838:f6b9897e:c216616c Update Time : Mon Oct 7 19:21:22 2013 Checksum : 6df566b8 - correct Events : 32621 Layout : left-symmetric Chunk Size : 512K Device Role : Active device 3 Array State : AAAA ('A' == active, '.' == missing) /dev/sde1: Magic : a92b4efc Version : 1.2 Feature Map : 0x0 Array UUID : 4dc53f9d:f0c55279:a9cb9592:a59607c9 Name : NAS:0 Creation Time : Sun Sep 11 02:37:59 2011 Raid Level : raid5 Raid Devices : 4 Avail Dev Size : 3907027053 (1863.02 GiB 2000.40 GB) Array Size : 5860538880 (5589.05 GiB 6001.19 GB) Used Dev Size : 3907025920 (1863.02 GiB 2000.40 GB) Data Offset : 2048 sectors Super Offset : 8 sectors State : clean Device UUID : e84657dd:0882a7c8:5918b191:2fc3da02 Update Time : Tue May 27 18:46:12 2014 Checksum : 33ab6fe - correct Events : 1026039 Layout : left-symmetric Chunk Size : 512K Device Role : Active device 1 Array State : AAA. ('A' == active, '.' == missing)

EEAA · Accepted Answer

ドライブの1つが6か月の間停止している、ダブルドライブ障害が発生しました。 RAID5では、これは回復不能です。故障したハードウェアを交換し、バックアップから復元します。

今後は、このような大規模なドライブを備えたRAID6を検討してください。必ずデバイスの障害をキャッチして、できるだけ早く対応できるように監視を行ってください。

S.Haran · Answer

バックアップが最新でない場合は、3台のドライブを使用して劣化モードで強制再組み立てを試すことができます...

mdadm -v --assemble --force/dev/md0/dev/sdb1/dev/sdc1/dev/sde1

また、sde1は更新時間とイベント数とわずかに同期していないため、ほとんどのデータにアクセスできると思います。私はこれを同様のRAID5障害シナリオで何度も成功させてきました。

sdb1更新時間：2014年5月27日火曜日18:54:37
sdc1更新時間：2014年5月27日火曜日18:54:37
sdd1更新時間：2013年10月7日月曜日19:21:22
sde1更新時間：2014年5月27日火曜日18:46:12
sdb1イベント：1026050
sdc1イベント：1026050
sdd1イベント：32621
sde1イベント：1026039