ハードウェアRAID10構成の4台のHDDを備えた専用サーバーがあり、昨日、数分でランダムにクラッシュし始めるまで正常に動作しました。データセンターに連絡し、システム診断を実行したところ、RAID 10アレイのHDDの1つに欠陥があることがわかり、ドライブを交換して、自動的に再構築を開始しました。次に、システムを通常モードで起動し、システムが再びクラッシュし始めたとき、15分間正常に動作していました。私は自分でいくつかの診断を行い、物理ドライブの状態を次のように確認しました。
arcconf GETCONFIG 1 PD
HDD 0,0にSMARTエラーがあることに気づき、DCに報告し、これを確認して、そのデバイスを新しいデバイスと交換するように要求しましたが、バックアップを作成するように提案されましたデータが失われる可能性が非常に高いため、データ(〜2TB)のデータをバックアップし、2台目のHDDを交換しました。起動後、RAIDコントローラーを強制的に起動し、システムをリカバリモードで起動する必要がありました。 。異なるミラーセットで2つのドライブが同時に故障する可能性は非常に低いため、最初に間違ったドライブを交換したと思いますが、それは別の話です…私の問題は、2番目に交換したHDDがそれ自体を再構築していないことです。そのドライブのメタデータを次のようにクリアしようとしました:
arcconf TASK START 1 DEVICE 0 0 CLEAR
ドライブの状態をホットスペアとして設定するよりも
arcconf SETSTATE 1 DEVICE 0 0 HSP LOGICALDRIVE 0
したがって、再構築プロセスを自動的に開始しますが、成功しません。
私のRAID10アレイデータは4台のHDDドライブです。HDD0,0とHDD0,1はミラーセットにあり、HDD0,2とHDD0,3は別のドライブにあります。
論理デバイス状態からの出力は次のとおりです。arcconfgetconfig1ld
https://dl.dropbox.com/u/10839791/ld.txt
また、物理ドライブ状態からの出力は次のとおりです。arcconfGETCONFIG 1 PD
https://dl.dropbox.com/u/10839791/pd.txt
コントローラーのステータス:
https://dl.dropbox.com/u/10839791/controller.txt
私の質問は、データを失うことなく、そのドライブを自分で再構築する方法があるかどうかです。
ありがとう。
答えは、adaptecコントローラーが一度に1つのドライブしか再構築しないということかもしれないと思います。
4つのグループを持つRAID10にAdaptec5805Zコントローラーがあります。各グループから1つのドライブを交換したばかりで、現在再構築中のグループは1つだけです。交換用ドライブはすべて不良ブロックを実行したため、すべて良好であることがわかっています。さらに、交換するドライブよりも確実に大きいです。
@SkechBoy、最初のグループの再構築が2番目のグループの再構築が始まる前に終了したかどうか知っていますか?
更新:Adaptecから「コントローラーは通常一度にセグメントを再構築する」という確認を受け取りました。つまり、最初のRAIDグループが再構築されるのを待ってから、2番目のRAIDグループの再構築を開始する必要があります。