web-dev-qa-db-ja.com

Emulex FCHBAがリセットされない

古いEmulexHBAを搭載したSolaris11マシンには、いくつかの問題があるようです。

# dmesg | egrep emlxs
Dec 29 15:31:10 san2 emlxs: [ID 349649 kern.info] [ 5.0608]emlxs1: NOTICE: 730: Link reset. (Disabling link...)
Dec 29 15:31:10 san2 emlxs: [ID 349649 kern.info] [ 5.0333]emlxs1: NOTICE: 710: Link down.
Dec 29 15:31:11 san2 emlxs: [ID 349649 kern.info] [ B.1FD3]emlxs1: NOTICE: 930: Packet transport failed. (*Node not found. did=10300)

Emlxadm(デュアルHBA PCI-Xカード)を使用して影響を受けるアダプターをリセットしようとすると、エラーがスローされ、リセットされません。

# /opt/EMLXemlxu/bin/emlxadm

Available Emulex HBA's:

1. FCT:emlxs0      : /devices/pci@0,0/pci8086,25e2@2/pci8086,350c@0,3/pci1014,1a7@1/pci10df,f980@4 (CONNECTED)
2. FCT:emlxs1      : /devices/pci@0,0/pci8086,25e2@2/pci8086,350c@0,3/pci1014,1a7@1/pci10df,f980@5 (NOT CONNECTED)

Enter an HBA number or zero to exit: 2

HBA 2: /devices/pci@0,0/pci8086,25e2@2/pci8086,350c@0,3/pci1014,1a7@1/pci10df,f980@5

emlxadm> get_fw_rev

Firmware revision: LP9802DC 1.92a1

emlxadm> reset_hard

ioctl: FCIO_RESET_HARD: Device busy
fcio:  FCIO_RESET_HARD: Operation successful.

> exit

# fcadm force-lip 10000000c93a3e6b
Error: Failed to reinitialize the link of HBA 10000000c93a3e6b

fmdumpにはエラーが記録されていません。再起動すると問題が解決するようで、まれにしか表示されません。 HBAは、5.30バージョンのFabricOSを使用してBrocadeSilkwormに接続されています。

更新:ファームウェアは最新/最高で、ドライバーのバージョンは2.60fです。

ポートをリセットし、Silkwormの電源を入れ直してみましたが、EmulexHBAがGBICPHYをオフにしたため、ポートはオフライン状態のままです。

SW3014BC2_B:admin> portshow 13
portName:
portHealth: No Fabric Watch License

Authentication: None
portDisableReason: None
portCFlags: 0x1
portFlags: 0x4001        PRESENT U_PORT LED
portType:  4.2
portState: 2    Offline
portPhys:  4    No_Light

考えられる原因や、再起動せずに接続を回復する方法についてのアイデアはありますか?

2
the-wabbit

問題が最後に「ハードウェアっぽい」ように見えたので、HBAを交換することになりました。

0
the-wabbit

そのHBAポートはターゲットポートに接続されています。少しの間切断し、リセットしてから再接続してください。 SANの設計がわからないので、これを行う最も簡単な方法はわかりませんが、スイッチのポートシャットダウンが最も簡単で迅速な方法かもしれないと思います。

2
Chopper3