web-dev-qa-db-ja.com

LSI MegaRAID SAS 9261-8i:交換後にディスクが認識されない

LSI MegaRAID SAS 9261-8i RAIDコントローラーを内蔵したSupermicroサーバーがあります。コントローラーに接続された3つのディスクがRAID5アレイとして構成されていました。最近、ディスクの1つに障害が発生しました( RAIDは劣化していると表示されます)、SMART情報を確認したところ、交換する必要があることがわかりました。

Storcliを使用してドライブに欠落のマークを付け、ベンダーに出荷するためにドライブを取り外しました。ディスクの交換品が届きました。RAIDコントローラーに接続しましたが、何も起こりませんでした。これはstorcliが言うことです:

storcli /c0 show

TOPOLOGY :
========

------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT     Size PDC  PI SED DS3  FSpace 
------------------------------------------------------------------------
 0 -   -   -        -   RAID5 Dgrd  N  5.456 TB dflt N  N   none Y      
 0 0   -   -        -   RAID5 Dgrd  N  5.456 TB dflt N  N   none Y      
 0 0   0   -        -   DRIVE Msng  -  2.728 TB -    -  -   -    -      
 0 0   1   252:5    14  DRIVE Onln  N  2.728 TB dflt N  N   none -      
 0 0   2   252:2    11  DRIVE Onln  N  2.728 TB dflt N  N   none -      
------------------------------------------------------------------------

ご覧のとおり、スロット2と5の両方のドライブがオンラインであり、デバイスグループ(DG)の別のドライブが欠落としてマークされています。 3番目のドライブはスロット0にあり、交換はスロット1にありますが、物理デバイスリスト(上記と同じコマンドからの出力)にも表示されるように、新しいドライブはコントローラーによって認識されません。

Physical Drives = 2

PD LIST :
=======

-----------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                  Sp 
-----------------------------------------------------------------------------
252:2    11 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD3000FYYZ-01UL1B0 U  
252:5    14 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD3000FYYZ-01UL1B0 U  
-----------------------------------------------------------------------------

それとは対照的に、次の出力を参照してください。

storcli /c0/pall show

PhyInfo :
=======

----------------------------------------------------------------------------
PhyNo SAS_Addr           Phy_Identifier Link_Speed Device_Type  Description 
----------------------------------------------------------------------------
    0 0x0000000000000000              0 No limit   -            -           
    1 0x4433221101000000              0 No limit   End Device   -           
    2 0x0000000000000000              0 No limit   -            -           
    3 0x0000000000000000              0 No limit   -            -           
    4 0x4433221104000000              0 No limit   End Device   -           
    5 0x0000000000000000              0 No limit   -            -           
    6 0x4433221106000000              0 No limit   End Device   -           
    7 0x0000000000000000              0 No limit   -            -           
----------------------------------------------------------------------------

PhyNo 1が交換されたドライブだと思いますが、これがその痕跡を見つけることができる唯一のコマンドです。 Slot 1のすべてのスロット固有のコマンドはDrive not foundで終わります。

それについて何かアイデアはありますか?交換したドライブを、まったく同じセットアップ(同じRAIDコントローラー)の2番目のサーバーでテストしました。コントローラーは、UGoodとマークされたドライブを即座に検出します。これはUnconfigured Goodを意味するため、できませんでした。ドライブエラーになります。また、再起動を行い、数分間シャットダウンし、起動中にLSI MegaRaid BIOSを使用して新しいドライブを検出しようとしましたが、成功しませんでした。ドライブがLSIMegaRaidBIOSブートメッセージに表示されません。

ヒントをいただければ幸いです。

1
morten.c

結局のところ、この動作はHDDが不足している-が交換されたことが原因でした。 2番目のサーバーが新しいHDDを問題なく認識したため、私はそれを取得できませんでしたが、おそらくこれがこのバージンハードドライブの最後の息吹でした。

データセンターグレードのHDD(WD REシリーズ、質問する前に)による到着時の欠陥は予想していませんでした。未来、時間を無駄にする前に。

1
morten.c