HP Smart Array P410が回復の準備ができてスタック00.0％

Question

スーパーマイクロサーバーでは、HPのスマートアレイディスクコントローラーP410を使用しています。

残念ながら、RAID10アレイのHDDが損傷し、その特定のハードディスクを交換せざるを得なくなりました。 3日後にサーバーを2回再起動した後も、HDDを交換した後、次のような最初の警告メッセージが表示されます。

警告ステータスメッセージ（（リカバリの準備ができました）論理ドライブ1（931.5 GB、RAID 1 + 0））776（リカバリの準備ができました）論理ドライブ1（931.5 GB、RAID 1 + 0）は再構築のためにキューに入れられます。

この問題が心配で、ファームウェアのアップデートを確認することにしました。最新のものであり、アップデートがないことを願っています。

RAIDCARDを同じモデルの新しいものに変更したことも注目に値します。 RAIDデバイス情報：

Firmware Version 6.40 Number of Ports 2 (Internal only) Number of Arrays 3 Smart Array P410 in Slot 1 Bus Interface: PCI Slot: 1 Serial Number: PACCR9SXRCQH Cache Serial Number: PAAVPID12031NLH RAID 6 (ADG) Status: Disabled Controller Status: OK Hardware Revision: C Firmware Version: 6.40 Rebuild Priority: Medium Expand Priority: Medium Surface Scan Delay: Not Available Surface Scan Mode: High Queue Depth: Automatic Monitor and Performance Delay: 60 min Elevator Sort: Enabled Degraded Performance Optimization: Disabled Inconsistency Repair Policy: Disabled Wait for Cache Room: Disabled Surface Analysis Inconsistency Notification: Disabled Post Prompt Timeout: 15 secs Cache Board Present: True Cache Status: OK Cache Ratio: 25% Read / 75% Write Drive Write Cache: Enabled Total Cache Size: 512 MB Total Cache Memory Available: 400 MB No-Battery Write Cache: Disabled Cache Backup Power Source: Batteries Battery/Capacitor Count: 1 Battery/Capacitor Status: OK SATA NCQ Supported: True

また、DIAGNOSTIC REPORT Wizardを実行しました。これは、デバイスのレポートです。

https://www.dropbox.com/s/vy6bo07xaraea1a/report-7c62988a-00000874-00000000.Zip

これは非常に苛立たしい状況です。サーバーは機能していますが、RAID10 ARRAYのHDDの1つが回復されず、RAID10アレイに結合されていません。

何をすべきか、そしてどのように問題を解決するか？

これは、HPコマンドラインでのこのコマンドの出力でもあります。ctrlallshow config detail

https://www.dropbox.com/s/zpadsxcx1emqlvi/ConfigurationsRAID.txt

宜しくお願いします

問題が発生した場合は、これら3台のHDDを交換することで問題を解決しました。最近のアドバイスに従います。

HDDを交換した後、RAIDCONTROLLERのBIOSUPDATECDを使用してサーバーを起動しました。その論理ドライブを削除して再作成し、BARE METALBACKUPを使用してサーバーをリカバリしました

すべてが正常に見え、ARRAY CONFIGURATIONUTILITYにエラーや警告は表示されません。

しかし、私は正常ではない何かを見ます。 ACUで、新しく作成された論理ドライブの詳細をクリックすると、このドライブのパーティションが記述されているセクションがあり、次の疑わしい行が表示されます：パーティション番号：1、サイズ：100 MB、マウントポイント：不明

マウントポイントはドライブCですが、なぜRAIDでは不明なのですか？サーバーは正常に起動します。

enter image description here

これは修正する必要があると思います。これについて何か考えがありますか？

ewwhite · Accepted Answer

構成を読むと、次のようになります。

合計8ディスク...

ディスク1、2、3、4はRAID 1 +0アレイにあります。
ディスク5、6はRAID0ストライプにあります。
ディスク7、8はRAID0ストライプです。

2つのRAID0アレイがある理由については質問しません。驚いたことに、彼らは健康です！

ディスク2が交換されたようです。ディスク4とペアになっています。ディスク4でREADエラーが発生し、ディスク2の再構築が妨げられている可能性があります。これらは基本的な500GBSATAディスクであり、すべてのディスクにいくつかの[〜＃〜]バス[〜＃〜]エラーがあります。実際、個々のドライブで明示的な読み取り/書き込みエラーカウントは表示されません...

実際には、Supermicroドライブのバックプレーンに問題がある可能性があります。

ディスク1、2、3には、「最後の障害の理由」としてWrite Retries Failed (0x2b)があります。

アレイ診断レポートの詳細を知りたい場合は、このガイドを参照をご覧ください。