web-dev-qa-db-ja.com

Sparc5440がCD-ROMからの起動中にハングする

元々64GBのRAMを128GBにアップグレードしようとしていたSunSparc 5440サーバーがあります。その過程で、SCSIルートディスクが破損しているようです。システムを再構築しようとしています。

Solaris 10のDVDがあります(このサーバーは実稼働サーバーをミラーリングしているため、要件です)。これは、Oracleからダウンロードした最新バージョンです(sol-10-u11-ga-sparc-dvd.iso)。 DVDをドライブに挿入してboot cdromを実行すると、しばらくの間DVDが動き、その後フリーズします。

DVDが別のSparcシステムで動作することを確認したため、それを除外しました。

また、DVDドライブであることも除外しました(USB-DVDドライブを接続し、そこから起動することにより)。

検索後、-vフラグを使用して起動しようとしました。これは、次の出力です。

{0} ok boot /pci@400/pci@0/pci@9/pci@0/usb@0,2/storage@1/disk -rsv
Boot device: /pci@400/pci@0/pci@9/pci@0/usb@0,2/storage@1/disk  File and args: -rsv
hsfs-file-system
Loading: /platform/Sun4v/boot_archive
ramdisk-root ufs-file-system
Loading: /platform/SUNW,T5440/kernel/sparcv9/unix
module /platform/SUNW,T5440/kernel/sparcv9/unix: text at [0x1000000, 0x10cbab5] data at 0x1800000
module /platform/SUNW,T5440/kernel/sparcv9/genunix: text at [0x10cbab8, 0x12b4e0f] data at 0x1a16800
module /platform/SUNW,T5440/kernel/misc/sparcv9/platmod: text at [0x12b4e10, 0x12b4e27] data at 0x1a6e4b0
module /platform/SUNW,T5440/kernel/cpu/sparcv9/SUNW,UltraSPARC-T2+: text at [0x12b4e30, 0x12bad2f] data at 0x1a6ec00
SunOS Release 5.10 Version Generic_147147-26 64-bit
Copyright (c) 1983, 2013, Oracle and/or its affiliates. All rights reserved.
os-io Ethernet address = 0:14:4f:ec:e9:b2
Using default device instance data
mem = 133857280K (0x1fea000000)
avail mem = 133886173184
root nexus = T5440
pseudo0 at root
pseudo0 is /pseudo
scsi_vhci0 at root
scsi_vhci0 is /scsi_vhci
ramdisk0 at root
ramdisk0 is /ramdisk-root
root on /ramdisk-root:a fstype ufs
virtual-device: cnex0
cnex0 is /virtual-devices@100/channel-devices@200
pseudo-device: dld0
dld0 is /pseudo/dld@0
px2 at root: 0x600 0x0
px2 is /pci@600
PCI Express-device: pci@0, pcieb10
pcieb10 is /pci@600/pci@0
PCIE-device: pci@c, pcieb12
pcieb12 is /pci@600/pci@0/pci@c
PCIE-device: SUNW,XVR-300@0, nfb0
nfb0 is /pci@600/pci@0/pci@c/SUNW,XVR-300@0
px0 at root: 0x400 0x0
px0 is /pci@400
PCI Express-device: pci@0, pcieb0
pcieb0 is /pci@400/pci@0
PCIE-device: pci@9, pcieb2
pcieb2 is /pci@400/pci@0/pci@9
PCIE-device: pci@0, pcieb4
pcieb4 is /pci@400/pci@0/pci@9/pci@0
PCIE-device: usb@0,2, ehci0
ehci0 is /pci@400/pci@0/pci@9/pci@0/usb@0,2
PCIE-device: usb@0, ohci0
ohci0 is /pci@400/pci@0/pci@9/pci@0/usb@0
PCIE-device: usb@0,1, ohci1
ohci1 is /pci@400/pci@0/pci@9/pci@0/usb@0,1
cpu0: UltraSPARC-T2+ (chipid 0, clock 1164 MHz)
cpu1: UltraSPARC-T2+ (chipid 0, clock 1164 MHz)
cpu2: UltraSPARC-T2+ (chipid 0, clock 1164 MHz)
...
cpu80: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu81: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu82: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
PCIE-device: pci@d, pcieb5
pcieb5 is /pci@400/pci@0/pci@d
cpu83: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu84: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
...
cpu104: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu105: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu106: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
USB 2.0 device (usb644,1008) operating at hi speed (USB 2.x) on USB 2.0 root hub: storage@1, scsa2usb2 at bus address 2
        TEAC USB DVD Reader DEF10BED1014
scsa2usb2 is /pci@400/pci@0/pci@9/pci@0/usb@0,2/storage@1
/pci@400/pci@0/pci@9/pci@0/usb@0,2/storage@1 (scsa2usb2) online
cpu107: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu108: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
cpu109: UltraSPARC-T2+ (chipid 1, clock 1164 MHz)
...
cpu157: UltraSPARC-T2+ (chipid 2, clock 1164 MHz)
cpu158: UltraSPARC-T2+ (chipid 2, clock 1164 MHz)
cpu159: UltraSPARC-T2+ (chipid 2, clock 1164 MHz)
USB 2.0 device (usb4b4,6560) operating at hi speed (USB 2.x) on USB 2.0 root hub: hub@2, hubd0 at bus address 3
hubd0 is /pci@400/pci@0/pci@9/pci@0/usb@0,2/hub@2
/pci@400/pci@0/pci@9/pci@0/usb@0,2/hub@2 (hubd0) online
cpu160: UltraSPARC-T2+ (chipid 2, clock 1164 MHz)
cpu161: UltraSPARC-T2+ (chipid 2, clock 1164 MHz)
cpu162: UltraSPARC-T2+ (chipid 2, clock 1164 MHz)
...
cpu216: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
sd3 at scsa2usb2: target 0 lun 0
sd3 is /pci@400/pci@0/pci@9/pci@0/usb@0,2/storage@1/disk@0,0
cpu217: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu218: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu219: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu220: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu221: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu222: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
USB 2.0 device (usb451,625f) operating at hi speed (USB 2.x) on USB 2.0 external hub: storage@3, scsa2usb3 at bus address 4
        Texas Instruments Incorporated 6250 FW: 04.01.02.22.562AD423 ACD6CE6E2E1A
scsa2usb3 is /pci@400/pci@0/pci@9/pci@0/usb@0,2/hub@2/storage@3
/pci@400/pci@0/pci@9/pci@0/usb@0,2/hub@2/storage@3 (scsa2usb3) online
cpu223: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu224: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu225: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu226: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu227: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu228: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu229: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu230: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu231: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
sd4 at scsa2usb3: target 0 lun 0
sd4 is /pci@400/pci@0/pci@9/pci@0/usb@0,2/hub@2/storage@3/disk@0,0
cpu232: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu233: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu234: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
...
cpu254: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
cpu255: UltraSPARC-T2+ (chipid 3, clock 1164 MHz)
/pci@400/pci@0/pci@9/pci@0/usb@0,2/storage@1/disk@0,0 (sd3) online
/pci@400/pci@0/pci@9/pci@0/usb@0,2/hub@2/storage@3/disk@0,0 (sd4) online
PCIE-device: SUNW,qlc@0, qlc0
qlc0 is /pci@400/pci@0/pci@d/SUNW,qlc@0
PCIE-device: SUNW,qlc@0,1, qlc1
qlc1 is /pci@400/pci@0/pci@d/SUNW,qlc@0,1
px1 at root: 0x500 0x0
px1 is /pci@500
PCI Express-device: pci@0, pcieb6
pcieb6 is /pci@500/pci@0
PCIE-device: pci@9, pcieb7
pcieb7 is /pci@500/pci@0/pci@9
PCIE-device: SUNW,qlc@0, qlc2
qlc2 is /pci@500/pci@0/pci@9/SUNW,qlc@0
PCIE-device: SUNW,qlc@0,1, qlc3
qlc3 is /pci@500/pci@0/pci@9/SUNW,qlc@0,1
fp5 is /pci@400/pci@0/pci@d/SUNW,qlc@0,1/fp@0,0
fp4 is /pci@400/pci@0/pci@d/SUNW,qlc@0/fp@0,0
fp6 is /pci@500/pci@0/pci@9/SUNW,qlc@0/fp@0,0
fp7 is /pci@500/pci@0/pci@9/SUNW,qlc@0,1/fp@0,0
PCIE-device: pci@1, pcieb1
pcieb1 is /pci@400/pci@0/pci@1
PCIE-device: pci@c, pcieb3
pcieb3 is /pci@400/pci@0/pci@c
PCIE-device: pci@c, pcieb8
pcieb8 is /pci@500/pci@0/pci@c
PCIE-device: pci@d, pcieb9
pcieb9 is /pci@500/pci@0/pci@d
PCIE-device: pci@9, pcieb11
pcieb11 is /pci@600/pci@0/pci@9
PCIE-device: pci@d, pcieb13
pcieb13 is /pci@600/pci@0/pci@d
px3 at root: 0x700 0x0
px3 is /pci@700
PCI Express-device: pci@0, pcieb14
pcieb14 is /pci@700/pci@0
PCIE-device: pci@9, pcieb15
pcieb15 is /pci@700/pci@0/pci@9
PCIE-device: pci@c, pcieb16
pcieb16 is /pci@700/pci@0/pci@c
iscsi0 at root
iscsi0 is /iscsi

私たちはそれを一晩置いたままにしました、そしてそれは決してそれ以上進みません。

何がうまくいかない可能性があるか、これをさらにデバッグするための提案はありますか?

2
Alcanzar

他のシステムのディスクをハードウェアRAIDに交換したようです。このRAIDを削除する必要がありますORアクティブ化してください。

最初の方法。

より長い方法はOS経由で削除することですが、OBPについて最小限の知識が必要です。起動中にエイリアンRAIDが表示されると、Solarisがハングします。そのため、すべてのディスクを削除してDV​​Dまたはネットから起動し、solarisの起動時にディスクを挿入する必要があります。 。次に、devfsadmを介してディスクをスキャンし、raidctlを介してRAIDを削除します。サーバーの近くにいる必要があるため、この方法は好きではありません。

2番目の方法。

OBPを介して内部ディスクでエイリアンRAIDをアクティブ化するため。

ok setenv fcode-debug? true
ok setenv auto-boot? false
ok reset-all

Selectコマンドを実行します。これはプラットフォームに依存します。プラットフォームの正しいパスを思い出させるために、show-disksコマンドを見ることができます。

T5440のパス選択手順:

ok select /pci@400/pci@0/pci@1/scsi@0/

また、私は他の人々のために他のプラットフォームの選択肢を提供します。

T1000のパス選択手順

ok select /pci@7c0/pci@0/pci@8/scsi@2

T2000のパス選択手順(pn 501-6843)

ok select /pci@7c0/pci@0/pci@1/pci@0,2/LSILogic,sas@2

T2000(pn 501-7501)のパス選択手順:

ok select /pci@780/pci@0/pci@9/scsi@0

V215/V245のパス選択手順:

ok select /pci@1e,600000/pci@0/pci@a/pci@0/pci@8/scsi@1

V445 /ボストンのパス選択手順:

ok select /pci@1f,700000/pci@0/pci@2/pci@0/pci@8/LSILogic,sas@1

501-7244を使用したV445のパス選択命令SASコントローラー

ok select /pci@1e,600000/pci@0/pci@2/scsi@0

T5120/T5220/Huronのパス選択手順:

ok select /pci@0/pci@0/pci@2/scsi@0

T5140/T5240のパス選択手順:

ok select /pci@400/pci@0/pci@8/scsi@0/

この後、OBPからRAIDボリュームを管理できます。

ok show-volumes ( Look for the inactive volume)
ok X activate-volume (X is the volume number)

また、を介してボリュームを削除することができます

ok X delete-volume (X is the volume number)

終わる:

ok unselect-dev
ok probe-scsi-all (to check for disks)

複数のボリュームを処理する場合は、それらが降順でアクティブ化されていることを確認してください。

ok show-volumes
ok 1 activate-volume
ok 0 activate-volume
ok unselect-dev
ok probe-scsi-all (to check for disks)

そうしないと、次のエラーが発生し、2番目のボリュームをアクティブ化する前にすべてリセットする必要があります。

ok 0 activate-volume
Volume 0 is now activated
ok 1 activate-volume
RAID volume request failed, ioc-status = 0007
Volume 1 could not be activated

アクティベーション後、両方のボリュームの同期が完了するまで、最初のボリュームは「劣化」したままになります。

値を返すことを忘れないでください:

ok setenv fcode-debug? true
ok setenv auto-boot? true
ok reset-all
2
Sasha Golikov