web-dev-qa-db-ja.com

RAID1で別のファイルをコピーするとファイルが破損する

Fedora12ボックスに2台の1TBドライブのRAID1構成があります。保存されているもののほとんどは、数値でラベル付けされたビデオファイルです。私が抱えている問題は、ビデオファイルの1つが破損していたことです。バックアップから置換をコピーし、不良ファイルを置換しましたが、正常に動作するようになりました。ただし、これを実行すると、次の番号のファイルが350MBから200KBになり、約0.5秒を除くすべてのビデオが消えます。その後、そのファイルを置き換えると、次のファイルが発生します。

例:

Replace corrupt file 1.avi and file 2.avi shrinks to 200KB.
Replace now corrupted 2.avi and it works but 3.avi gets screwed up.

ドライブでSMARTテストを実行しましたが、正常に報告されています。何が起こっているのかを理解するために実行できるテストはありますか?

編集:それはext4ファイルシステムを備えた2ディスクソフトウェアRAID1です

4
Stephan

私はあなたが探しているテストがあなたがまだ知らないことをあなたに教えてくれるかわかりません。

ファイルシステムが破損しています。

最も簡単な解決策は、データを別のシステム(ファイルシステムが機能している)にコピーして検証し、既存のシステムのRAIDを吹き飛ばすことです。ドライブを個別に再フォーマットし、RAIDを再構築した後、既存のシステムに再度進むことができます。

Server2003のソフトウェアRAIDを使用していたServer2003システムでも同じことが起こりました。アレイへの書き込み中に電源障害またはシステムクラッシュが発生し、ディスクが同期しなくなったため、ファイルシステムはあなたが説明しているのと同じ症状を示しました。 (同様に、私が実行したすべてのテストは私に嘘をつき、ディスクとアレイは明らかにそうではありませんでしたが、完全に正常であると言いました。)アレイの特定のポイントの後にコピーされたものはすべて破損します。データはファイルの最初の約500KBで有効であり、その後はジャンクでした。画像は上部のx%がきれいに表示され、下部が白くなり、ドキュメントには有効なデータの数ページまたは行が含まれ、意味不明になるなどです。また、破損ポイントの「前」にファイルを追加すると、破損が発生します。破損がアレイの特定のポイントから約500KBオフセットされたかのように、「次の」ファイルに移動しているように見えます。

アレイ内のどのディスクにファイルシステムの破損が含まれているのかを特定できる場合は、破損したデータのあるディスクを引き出し、アレイを強制的に再構築することで問題を修正できる可能性があります。良いディスク。(私にとっては、破損が1つのディスクにのみ存在すると仮定します。)それは私にとってはうまくいき、破損したアレイ上のデータを回復する方法でした。 2ディスクミラーRAIDだけで、各ディスクに基づいて強制的に再構築し、どのアレイが機能し、どのアレイが破損するかを確認することもできます。

その後もまだ信用できなかったので、データをコピーしてアレイを削除し、ディスクを再フォーマットし、OSを再インストールして、ネットワーク上でソフトウェアRAIDを使用していることがわかった場合は、楽しいことをするように警告しました。再び。同じことをお勧めします。ええと、少なくともデータに関しては。 LinuxソフトウェアRAIDを放棄してユーザーを脅かすかどうかは、個人的な好みです。

3
HopelessN00b

ファイルシステムに問題があるようです。ファイルシステムをアンマウントし、ファイルシステムでfsck -fを実行して確認します。 -fフラグは、ファイルシステムがクリーンであるように見えても、fsckに実行するように指示します。

4
MikeyB

セオドア・ツォのdebugfsを試してみてください。

http://linux.die.net/man/8/debugfs

これを使用して、ファイルシステムをインタラクティブにデバッグできます。どのiノードがどのファイルに対応するかなどを確認します。

1
Charles Hepner