web-dev-qa-db-ja.com

RAID10での単一ディスク障害によりデータが利用できなくなる

私はここで奇妙な状況にあります。 PERCH310ミニコントローラを搭載したDellR620を持っています。 2つのRAIDアレイ、OS用の2つのディスクミラー、およびDATAドライブ用の6つのディスクRAID10があります。 RAID10で1つのディスクに障害が発生すると、データが使用できなくなり、Windowsのディスク管理で無効として表示されます。これは正常な動作ですか?単一のディスクに障害が発生すると、新しいディスクが追加されるまで単に劣化モードになると思いましたが、代わりにボリュームが完全に失われました。ちなみに、先週、3つのディスク障害が発生しました。それらは関連する問題ではないと思いますが、私は間違っている可能性があります。助けてくれてありがとう。

1
Fr0ntSight

RAID-10アレイで単一のディスクに障害が発生しても、ボリュームが使用できなくなることはないはずです。 PERCコントローラーに問題がある可能性があります。

Dell OpenManage Server AdministratorまたはiDRACにアクセスして、そこに情報が報告されているかどうかを確認する必要があります。 Windowsイベントログを確認することもできます(OSMAがインストールされ、それらのログにイベントを書き込むように構成されている場合)。

コントローラまたはバックプレーンで利用可能なファームウェアやドライバのアップデートがある場合は、それらをインストールすることを検討してください。可能であれば、アレイが正常な状態でこれを行うことをお勧めします。

複数のディスクに障害が発生している可能性もあります。 which RAID-10セットのディスクに障害が発生した場合、アレイをオフラインにせずに複数(この場合は最大3つ)を失う可能性があります。ただし、2つだけを失ったが、それらが同じRAID-1ペアにある場合、アレイ全体がダウンします。

システムがまだ保証期間中の場合は、デルのサポートに連絡することを忘れないでください。彼らはこのような問題の診断を助けるのに非常に優れています。

週に3回のディスク障害は、特にそれらがすべて同時に使用され、同じ量の摩耗がある場合、考えられない状況ではありません。しかし、これが私に起こった場合、私はコントローラーまたはバックプレーンを疑うようになります。

IDRACにアクセスして、RAIDコントローラーに関するログに障害がないかどうかを確認できますか?

また、SMART障害が発生したディスクと、現在実行中のメンバーのチェックを実行していますか?これにより、ディスク自体が不良であるかどうかが明らかになり、それらがどのように実行されているかがわかります。アプリケーションsmartctlsmartmontoolsスイートの一部であり、Windows環境にインストールして使用できます。ドライブにアクセスする方法については、manページを参照してください。 RAIDコントローラ、特に-dオプションを介して。

0
Spooler