web-dev-qa-db-ja.com

ディスクの表示サイズをアップグレードするときにRAIDを拡張/サイズ変更

最初は、ディスクあたり2TBしかアドレスできないコントローラーを使用してソフトウェアRAIDを作成しました。ディスクは3 TBディスクです。正常に動作しましたが、各ディスクの最初の2TBのみを使用しました。

コントローラーを変更して、3TB全体を表示しました。したがって、/dev/md0最後の1 TBも使用します。

私が試してみました:

# mdadm --grow /dev/md0 --size=max
mdadm: component size of /dev/md0 has been set to 2147479552K

しかし、ご覧のとおり、2TBしか見えません。私がそれをより強く強制しようとすると:

# mdadm --grow /dev/md0 --size=2147483648
mdadm: Cannot set device size for /dev/md0: No space left on device

したがって、システムはディスクが3TB(/proc/partitions)、しかしRAIDはそれらを3TBとして認識できません。

mdadmの詳細:

# mdadm --detail /dev/md0
/dev/md0:
    Version : 1.2
Creation Time : Fri Mar  2 15:14:46 2012
 Raid Level : raid6
 Array Size : 38654631936 (36863.93 GiB 39582.34 GB)
Used Dev Size : 2147479552 (2048.00 GiB 2199.02 GB)
Raid Devices : 20
Total Devices : 21
Persistence : Superblock is persistent

Update Time : Wed Apr 25 19:47:09 2012
      State : active
Active Devices : 20
Working Devices : 21
Failed Devices : 0
Spare Devices : 1

     Layout : left-symmetric
 Chunk Size : 4096K

       Name : node5:1
       UUID : 8603c3df:b740ba22:8c9c82fd:a18b3133
     Events : 845

Number   Major   Minor   RaidDevice State
  20      65       32        0      active sync   /dev/sds
   1      65       64        1      active sync   /dev/sdu
   2      65       80        2      active sync   /dev/sdv
   3      65       96        3      active sync   /dev/sdw
   4       8      192        4      active sync   /dev/sdm
   5       8       32        5      active sync   /dev/sdc
   6       8       48        6      active sync   /dev/sdd
   7       8       64        7      active sync   /dev/sde
   8       8       80        8      active sync   /dev/sdf
   9       8       96        9      active sync   /dev/sdg
  10       8      112       10      active sync   /dev/sdh
  11       8      128       11      active sync   /dev/sdi
  12       8      144       12      active sync   /dev/sdj
  13       8      160       13      active sync   /dev/sdk
  14       8      176       14      active sync   /dev/sdl
  15       8      208       15      active sync   /dev/sdn
  16       8      224       16      active sync   /dev/sdo
  17       8      240       17      active sync   /dev/sdp
  18      65        0       18      active sync   /dev/sdq
  19      65       16       19      active sync   /dev/sdr

  21      65       48        -      spare   /dev/sdt

ディスクサイズ:

# cat /proc/partitions |grep 2930266584
   8       48 2930266584 sdd
   8       32 2930266584 sdc
   8      112 2930266584 sdh
   8       96 2930266584 sdg
   8       80 2930266584 sdf
   8      128 2930266584 sdi
   8      176 2930266584 sdl
   8       64 2930266584 sde
  65       32 2930266584 sds
   8      192 2930266584 sdm
   8      144 2930266584 sdj
  65       80 2930266584 sdv
   8      224 2930266584 sdo
   8      208 2930266584 sdn
   8      160 2930266584 sdk
   8      240 2930266584 sdp
  65        0 2930266584 sdq
  65       64 2930266584 sdu
  65       16 2930266584 sdr
  65       48 2930266584 sdt
  65       96 2930266584 sdw

編集:

# mdadm --version
mdadm - v3.1.4 - 31st August 2010
# uname -a
Linux lemaitre 3.2.0-0.bpo.1-AMD64 #1 SMP Sat Feb 11 08:41:32 UTC 2012 x86_64 GNU/Linux

RAID6はディスク全体を使用します(つまり、パーティションはありません)。

今朝、システムがクラッシュしました。再起動後、システムはRAIDを検出しませんでした(これはひどいものでした)。すべてのディスクがスペア(S)として表示されました。

cat /proc/mdstat 
Personalities : 
md0 : inactive sdr[20](S) sds[21](S) sdq[18](S) sdp[17](S) sdo[16](S) sdn[15](S) sdl[14](S) sdk[13](S) sdj[12](S) sdi[11](S) sdh[10](S) sdg[9](S) sdf[8](S) sde[7](S) sdd[6](S) sdc[5](S) sdm[4](S) sdv[3](S) sdu[2](S) sdt[1](S)
      42949652460 blocks super 1.2

ここでも、mdadmが3 TBサイズを見つけられなかったことは明らかです。

私は走ったmdadm --stop /dev/md0。 /etc/mdadm/mdadm.confのエントリを削除しました。ランmdadm -A --scan --force、これによりRAIDがオンラインになり、再構築されました。

10
Ole Tange

私は/ sysをざっと見て、答えにかなり近づきました。

# cd /sys/block/md0/md
# cat component_size
2147479552

それは私たちが以前に見たものと一致します。しかしこれは:

# grep . dev-sd*/size
dev-sdc/size:2147482623
dev-sdd/size:2147482623
dev-sde/size:2147482623
dev-sdf/size:2930265560
dev-sdg/size:2147482623
dev-sdh/size:2147482623
dev-sdi/size:2147482623
dev-sdj/size:2147482623
dev-sdk/size:2147482623
dev-sdl/size:2147483648
dev-sdm/size:2147482623
dev-sdn/size:2147482623
dev-sdo/size:2147482623
dev-sdp/size:2147482623
dev-sdq/size:2147482623
dev-sdr/size:2147482623
dev-sds/size:2147482623
dev-sdt/size:2147482623
dev-sdu/size:2147482623
dev-sdv/size:2147482623
dev-sdw/size:2930265560

rAIDが間違ったサイズを表示する理由を説明しているようです。ほとんどのドライブは2TBと表示されますが、交換された2つは3TBと表示されます。すべてのドライブは同じモデルなので、認識されるサイズを変更できるかどうかを見てみましょう。

# parallel echo 2930265560 \> ::: dev-sd*/size
# grep . dev-sd*/size
dev-sdc/size:2930265560
dev-sdd/size:2930265560
dev-sde/size:2930265560
dev-sdf/size:2930265560
dev-sdg/size:2930265560
dev-sdh/size:2930265560
dev-sdi/size:2930265560
dev-sdj/size:2930265560
dev-sdk/size:2930265560
dev-sdl/size:2930265560
dev-sdm/size:2930265560
dev-sdn/size:2930265560
dev-sdo/size:2930265560
dev-sdp/size:2930265560
dev-sdq/size:2930265560
dev-sdr/size:2930265560
dev-sds/size:2930265560
dev-sdt/size:2930265560
dev-sdu/size:2930265560
dev-sdv/size:2930265560
dev-sdw/size:2930265560

出来上がり。ただし、Component_sizeはまだ小さいです。

# cat component_size
2147479552

Mdadmで変更できるかもしれません:

# mdadm --grow /dev/md0 --size=max

これにより、残念ながらmdadmがロックされ、その後の/ dev/md0へのアクセスがブロックされます。そして、component_sizeへのアクセスも同様です。

# cat component_size   # This blocks

吸います。しかし、良い点は、syslogでそれが言うことです:

Apr 27 20:45:50 server kernel: [124731.725019] md0: detected capacity change from 39582343102464 to 54010589478912

/ dev/md0上のファイルシステムは引き続き実行されました。

再起動後、もう一度「mdadm --grow/dev/md0 --size = max」を実行する必要がありました。次に、resyncが完了するのを待ちます。再び/ dev/md0へのアクセスがブロックされました。そのため、もう一度再起動してからxfs_growfs /dev/md0そして、サイズ変更が完了しました。

5
Ole Tange

作成時にデバイスのサイズがメタデータのどこかに登録されたと思います。コントローラを変更してもメタデータは変更されません。

Mdからスペアを削除し、新しいドライブとしてRAIDセットに再度追加します。おそらくメタデータを削除する必要があります(--zero-superblockのmanページを確認するか、ディスク全体を消去してください)。それが単一のディスクで機能する場合は、残りのすべてのドライブに対しても手順を繰り返します。次に、最後に--growを実行します。

同期が完了するまで追加のディスクを取り外さないでください!!

3
jippie