web-dev-qa-db-ja.com

HP MSA70 / P800アレイ障害-各スロットに2つのドライブが表示され、13/25ドライブが「欠落」している

HPP800コントローラーに接続された25x 600GB HP SAS 10kDPドライブを備えたHPMSA70があります。ドライブはRAID6で構成されています。

昨日、ある種の未知の「イベント」が発生し、アレイがオフラインになりました。サーバーを再起動し(CENTOS 6.2を実行)、起動時に、アレイコントローラーが13台のドライブが「欠落」していることを報告しました。アレイ管理でボリュームを見ると、スロット1〜12のスロットごとに2つのエントリがあります。 1つは600GBドライブを示し、もう1つは0GBドライブを示しています。 12以降のエントリはありません。

HPサポートに連絡しました。HPサポートはTier2サポートに送ってくれましたが、何時間もかけてあきらめました。彼らはこれまでこれを見たことがないと言った(ベンダーから聞いた私のお気に入りのこと)。

誰かがこれを以前に見たことがあり、すべてのデータを失ったことがありますか?

ありがとうございました。

3
NXTVoipguy

古い、古い、古い、古い.。

  • CentOS 6.2はold(6.2、2011年12月6日(カーネル2.6.32-220))
  • HP StorageWorks MSA70は古いです。 (サポート終了-2010年10月)
  • HP Smart Array P800は古いです。 (End of Life-2010)

ですから、ファームウェアやドライバーも古いと思います。例えば。 2015年にCentOS6.2を実行する理由はありません...そして、最新の状態に保つための努力は行われなかったと思います。

これはまた、システムが監視されていないことを私に思わせます。 HPサーバーハードウェアを想定すると、システムIMLログは何を示していますか? HP管理エージェントを実行していますか?そうでない場合は、サーバーとストレージの状態に関する重要なメッセージを見逃していた可能性があります。

HPアレイ構成ユーティリティ(または HP SSA )から情報を確認しましたか?

しかし、最終的には、ポート障害またはエクスパンダ/バックプレーン障害が発生した可能性があります。

  • エンクロージャーに接続されているSASケーブルの数は?1本のケーブルが接続されている場合、エンクロージャーのSASエキスパンダーが原因で、バックプレーンの問題が発生している可能性があります。
  • 2本のケーブルが接続されている場合は、SASケーブル、MSA70コントローラー、またはP800ポートに障害がある可能性があります。

データは無傷である可能性がありますが、問題を切り分けて、上記の問題のどれが原因であるかを判断する必要があります。 SASケーブルの交換は、MSA70コントローラーまたはRAIDコントローラーカードを交換するよりもはるかに簡単です... しかし、別のMSA70を$ 40で入手できると思いますeBayで...

5
ewwhite