web-dev-qa-db-ja.com

HP Smart Array P410が回復の準備ができてスタック00.0%

スーパーマイクロサーバーでは、HPのスマートアレイディスクコントローラーP410を使用しています。

残念ながら、RAID10アレイのHDDが損傷し、その特定のハードディスクを交換せざるを得なくなりました。 3日後にサーバーを2回再起動した後も、HDDを交換した後、次のような最初の警告メッセージが表示されます。

警告ステータスメッセージ((リカバリの準備ができました)論理ドライブ1(931.5 GB、RAID 1 + 0))776(リカバリの準備ができました)論理ドライブ1(931.5 GB、RAID 1 + 0)は再構築のためにキューに入れられます。

この問題が心配で、ファームウェアのアップデートを確認することにしました。最新のものであり、アップデートがないことを願っています。

RAIDCARDを同じモデルの新しいものに変更したことも注目に値します。 RAIDデバイス情報:

Firmware Version 6.40
Number of Ports 2 (Internal only)
Number of Arrays 3
    Smart Array P410 in Slot 1
Bus Interface: PCI
Slot: 1
Serial Number: PACCR9SXRCQH
Cache Serial Number: PAAVPID12031NLH
RAID 6 (ADG) Status: Disabled
Controller Status: OK
Hardware Revision: C
Firmware Version: 6.40
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: Not Available
Surface Scan Mode: High
Queue Depth: Automatic
Monitor and Performance Delay: 60 min
Elevator Sort: Enabled
Degraded Performance Optimization: Disabled
Inconsistency Repair Policy: Disabled
Wait for Cache Room: Disabled
Surface Analysis Inconsistency Notification: Disabled
Post Prompt Timeout: 15 secs
Cache Board Present: True
Cache Status: OK
Cache Ratio: 25% Read / 75% Write
Drive Write Cache: Enabled
Total Cache Size: 512 MB
Total Cache Memory Available: 400 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: True

また、DIAGNOSTIC REPORT Wizardを実行しました。これは、デバイスのレポートです。

https://www.dropbox.com/s/vy6bo07xaraea1a/report-7c62988a-00000874-00000000.Zip

これは非常に苛立たしい状況です。サーバーは機能していますが、RAID10 ARRAYのHDDの1つが回復されず、RAID10アレイに結合されていません。

何をすべきか、そしてどのように問題を解決するか?

これは、HPコマンドラインでのこのコマンドの出力でもあります。ctrlallshow config detail

https://www.dropbox.com/s/zpadsxcx1emqlvi/ConfigurationsRAID.txt

宜しくお願いします


問題が発生した場合は、これら3台のHDDを交換することで問題を解決しました。最近のアドバイスに従います。

HDDを交換した後、RAIDCONTROLLERのBIOSUPDATECDを使用してサーバーを起動しました。その論理ドライブを削除して再作成し、BARE METALBACKUPを使用してサーバーをリカバリしました

すべてが正常に見え、ARRAY CONFIGURATIONUTILITYにエラーや警告は表示されません。

しかし、私は正常ではない何かを見ます。 ACUで、新しく作成された論理ドライブの詳細をクリックすると、このドライブのパーティションが記述されているセクションがあり、次の疑わしい行が表示されます:パーティション番号:1、サイズ:100 MB、マウントポイント:不明

マウントポイントはドライブCですが、なぜRAIDでは不明なのですか?サーバーは正常に起動します。

enter image description here

enter image description here

これは修正する必要があると思います。これについて何か考えがありますか?

2
Armin

構成を読むと、次のようになります。

合計8ディスク...

  • ディスク1、2、3、4はRAID 1 +0アレイにあります。
  • ディスク5、6はRAID0ストライプにあります。
  • ディスク7、8はRAID0ストライプです。

2つのRAID0アレイがある理由については質問しません。驚いたことに、彼らは健康です!

ディスク2が交換されたようです。ディスク4とペアになっています。ディスク4でREADエラーが発生し、ディスク2の再構築が妨げられている可能性があります。これらは基本的な500GBSATAディスクであり、すべてのディスクにいくつかの[〜#〜]バス[〜#〜]エラーがあります。実際、個々のドライブで明示的な読み取り/書き込みエラーカウントは表示されません...

実際には、Supermicroドライブのバックプレーンに問題がある可能性があります。

ディスク1、2、3には、「最後の障害の理由」としてWrite Retries Failed (0x2b)があります。

アレイ診断レポートの詳細を知りたい場合は、 このガイドを参照 をご覧ください。

1
ewwhite