私はこれを修正するための解決策をインターネットで検索しようとしています。私は私の組織の新しいIT担当者であり、以前のITは特定の事柄について記録を残していません。私はそれが悪い習慣であることを理解していますが、私は現在、将来の参考のためにこれらすべてをドキュメントに作成しています。
そうは言っても;最近、サーバーで問題が発生しました。 ESXi5.0でHPProliant DL180Gen6サーバーを使用しています...問題は次のとおりです。 I/Oエラーが発生したため、特定のVMの電源を入れることができません。以下に見られるのはエラーです。
理由:0(入出力エラー)。ディスク '/vmfs/volumes/4e7a4edb-08851e40-0c1e-1cc1de700f23/EON-GATEWAY(192.168.0.1)/ EON-GATEWAY(192.168.0.1)-000001.vmdk'またはそれが依存するスナップショットディスクの1つを開くことができません。
いわば、すべてのVMの電源を切り、ホストを再起動してBIOSにジャンプし、RAIDで監視しました。サーバーがどのタイプのRAIDを使用しているかはわかりませんが、次のように表示されます。
SLOT1のエラー:ベイ11 私が覚えているように)
問題が正確に何であるかを確認する方法はありますか。なぜなら、影響を受けたハードディスクがまだ緑色のLEDを点滅していることがわかります。 12ベイのうち..ベイ1はオレンジ色のLEDを示し、ベイ4は何も示していません。
これを並べ替える方法がかなり混乱しています。誰かが私にこれをソートするために正確に何をする必要があるかを教えてくれるか、RAID /アレイ情報をチェックする方法のヒントになるかもしれません。
以下の画像はスマートアレイコントローラーからのものです...
これがサーバーのHDDへの---(ビデオリンクです。ベイ1が青と琥珀色に点滅し、他のベイが青になっているので、私はまだ興味があります(上記のスマートアレイ画面上)。
これは、 VMwareの問題 または仮想ディスクのロックの問題である可能性があります。完全なエラーメッセージをキャプチャできますか? other仮想マシンは問題なくパワーオンしますか?
それにもかかわらず、物理ストレージの問題もあるようです。
DL180G6でのHPSmart ArrayP410構成出力は次のようになります。
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 2 TB, OK)
physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 2 TB, OK)
physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 2 TB, OK)
physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 2 TB, OK)
physicaldrive 2I:1:5 (port 2I:box 1:bay 5, SAS, 2 TB, OK)
physicaldrive 2I:1:6 (port 2I:box 1:bay 6, SAS, 2 TB, OK)
あなたはsure1I:1:1
のドライブ指定を間違えていないことを確認します。これは、(port 1I:box 1:bay 1)
を "SLOT1:Bay 11"?これは、最初のドライブベイの琥珀色/オレンジ色のライトを説明します。
このサーバーが十分に文書化されていないことを考えると、RAID5でも構成されている可能性が高いです(平均?おそらく)。
F1
)サーバーの電源が入っている場合は、ESXi内からRAID構成を表示できます。これを行うには、Hardware Status > Sensors > Storage
に移動します。
If ESXiがHP固有のVMwareイメージを使用してインストールされている場合、そこにRAID構成が表示されます。
VMwareの内部に何も表示されない場合は、再起動してBIOSレベルでRAID構成を表示する必要があります。
システムの電源がオンになっているときに、Smart Array P410構成ユーティリティを入力するように求められたら、F8
キーを押します。
中に入ると、 "論理ドライブの表示"を選択します。
これにより、RAIDヘルスステータスが表示され、詳細についてはEnter
を押すことができます。これにより、アレイ内のどのディスクが良い/悪い/欠けているかが最終的にわかります。
私は間違っているかもしれませんが、ここでは2つの問題があると思います。
はい、物理ディスクに問題があるようです。ダウンタイムを回避できる場合は、HP SPP/ACUイメージから起動してACUに移動し、診断を実行して、必要に応じて部品を交換してください。
ただし、最初のエラーは、データストアが実際に問題を抱えているようなローカルSAS/SATAディスクではなく、IPベース(NFSまたはiSCSI)であることを示しています。他のIPベースのデータストアはありますか?もしそうなら、私はそれらがどこに基づいているかを見て、何かがオフにされているか、削除されているかどうかを確認します。
運が良ければ、前任者がesxiサーバーの適切なHPイメージをボックスにインストールしている可能性があります。その場合、HPシステム管理ホームページにリモートでアクセスできるはずです。
https:// ipofyourserver:2381
これにより、サーバーの一般的な状態(アレイも含まれます)についてもう少し詳しく知ることができます。
そうでない場合は、P410iコントローラーの初期化が完了した後、サーバーを再起動してF8キーを押す必要があります。これで、ORCA(Option Rom Configuration of Arrays)にアクセスできます。 「論理ドライブを表示」を選択します。これにより、ローカル論理ドライブのリストが表示され、アレイが正常であるかどうかも示されます。 HPロゴが表示された後、P410i初期化メッセージを実際に表示するには、「任意のキーを押す」必要がある場合があることに注意してください。
最後にもう1つ、サーバーのストレージボックスの内部動作に問題が発生し、ドライブのLEDがミュート(オフ)になるか、スクランブルがかかって正常なドライブになることが何度か見られました。緑ではなく琥珀色に点滅します。ドライブアクティビティLEDをあまり深刻にしないように、公正な警告です:)
サーバー上でファームウェアアップグレードDVDを実行することも検討することをお勧めします。そのコントローラーファームウェアは古いです! raid-5アレイが元の形に戻ったら、ファームウェアDVDをダウンロードすることをお勧めします。それ以降のバージョンのコントローラーファームウェアには、かなりの修正と改善があります。
ここからダウンロードしてください:
それをUSBドライブに置いて起動するか、CDに書き込むか、または単にiloを介してisoファイルをマウントします。 DVDを実行すると、BIOS、NIC、およびILOファームウェアもアップグレードされることに注意してください。