LSI MegaRAID SAS 9261-8i RAIDコントローラーを内蔵したSupermicroサーバーがあります。コントローラーに接続された3つのディスクがRAID5アレイとして構成されていました。最近、ディスクの1つに障害が発生しました( RAIDは劣化していると表示されます)、SMART情報を確認したところ、交換する必要があることがわかりました。
Storcliを使用してドライブに欠落のマークを付け、ベンダーに出荷するためにドライブを取り外しました。ディスクの交換品が届きました。RAIDコントローラーに接続しましたが、何も起こりませんでした。これはstorcliが言うことです:
storcli /c0 show
TOPOLOGY :
========
------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type State BT Size PDC PI SED DS3 FSpace
------------------------------------------------------------------------
0 - - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 0 - - DRIVE Msng - 2.728 TB - - - - -
0 0 1 252:5 14 DRIVE Onln N 2.728 TB dflt N N none -
0 0 2 252:2 11 DRIVE Onln N 2.728 TB dflt N N none -
------------------------------------------------------------------------
ご覧のとおり、スロット2と5の両方のドライブがオンラインであり、デバイスグループ(DG)の別のドライブが欠落としてマークされています。 3番目のドライブはスロット0にあり、交換はスロット1にありますが、物理デバイスリスト(上記と同じコマンドからの出力)にも表示されるように、新しいドライブはコントローラーによって認識されません。
Physical Drives = 2
PD LIST :
=======
-----------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
-----------------------------------------------------------------------------
252:2 11 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
252:5 14 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
-----------------------------------------------------------------------------
それとは対照的に、次の出力を参照してください。
storcli /c0/pall show
PhyInfo :
=======
----------------------------------------------------------------------------
PhyNo SAS_Addr Phy_Identifier Link_Speed Device_Type Description
----------------------------------------------------------------------------
0 0x0000000000000000 0 No limit - -
1 0x4433221101000000 0 No limit End Device -
2 0x0000000000000000 0 No limit - -
3 0x0000000000000000 0 No limit - -
4 0x4433221104000000 0 No limit End Device -
5 0x0000000000000000 0 No limit - -
6 0x4433221106000000 0 No limit End Device -
7 0x0000000000000000 0 No limit - -
----------------------------------------------------------------------------
PhyNo 1
が交換されたドライブだと思いますが、これがその痕跡を見つけることができる唯一のコマンドです。 Slot 1
のすべてのスロット固有のコマンドはDrive not found
で終わります。
それについて何かアイデアはありますか?交換したドライブを、まったく同じセットアップ(同じRAIDコントローラー)の2番目のサーバーでテストしました。コントローラーは、UGood
とマークされたドライブを即座に検出します。これはUnconfigured Good
を意味するため、できませんでした。ドライブエラーになります。また、再起動を行い、数分間シャットダウンし、起動中にLSI MegaRaid BIOSを使用して新しいドライブを検出しようとしましたが、成功しませんでした。ドライブがLSIMegaRaidBIOSブートメッセージに表示されません。
ヒントをいただければ幸いです。
結局のところ、この動作はHDDが不足している-が交換されたことが原因でした。 2番目のサーバーが新しいHDDを問題なく認識したため、私はそれを取得できませんでしたが、おそらくこれがこのバージンハードドライブの最後の息吹でした。
データセンターグレードのHDD(WD REシリーズ、質問する前に)による到着時の欠陥は予想していませんでした。未来、時間を無駄にする前に。