web-dev-qa-db-ja.com

スワップファイルを除いて、RAID 1/10のmismatch_cnt> 0の原因は何ですか?

私のサーバーの4つのうち2つは現在mismatch_cnt約40000とそれは私を心配しています。 RAID10セットアップを使用しています。マニュアルによると、

ただし、RAID1およびRAID10では、ソフトウェアの問題により不一致が報告される可能性があります。これは、必ずしもアレイ上のデータが破損していることを意味するわけではありません。システムが配列のその部分に何が格納されているかを気にしないということかもしれません-それは未使用のスペースです。

サーバーではスワップファイルを使用していません。サーバーのHDDの1つにSMARTセルフチェックが失敗し、Available_Reservd_Spaceが低すぎます。ホスティングプロバイダーは、HDDが物理的に故障している場合にのみHDDを交換すると述べています。

このパラメータの本当の意味と有用性は理解できないと思います。このパラメータがこのように大きな値を持つ他の理由は何でしょうか?それがミラーリングされたものである場合、システムが配列のその部分に何があるかを気にしないのはどうしてですか?セキュリティ上の理由から、システムは空き領域を同期する必要があると思います。それでは、何が残っているのでしょうか。

サーバーに特定のHDDがあるリスクを見積もる信頼できる方法はありますか?

3

多くの場合、RAID1/10アレイのmismatch_cntが高い理由は2つあります。

  • アレイのスワップ
  • 非常に高速なファイルの作成/書き込み/書き換え/削除のワークロード

上記の理由は無害です:それらdoは配列(基本的には非同期配列)の違いを示していますが、それらは約未使用ディスク容量。

ただし、はるかに懸念され危険なmismatch_cnt原因があります。ハードウェアの問題(つまり、電源の供給に一貫性がない、またはディスクDRAMチップの動作に問題がある)により、飛行中のデータが変更され、 2つのディスク。

このスレッド の詳細については、linux-raidメーリングリストを参照してください。

2
shodanshok