web-dev-qa-db-ja.com

HDD S.M.A.R.Tの結果をどのように解釈しますか?

最近、私のラップトップは少し信頼性が低くなり始め、何らかの理由で、HDDが故障し始めているのではないかと疑い始めました。インターネットで少し探した後、システムメニューでUbuntuのディスクユーティリティを見つけ、これから長いSMART診断を実行しました。

ただし、ディスクユーティリティのドキュメントは非常に貧弱(palimpsest?)であるため、結果の解釈方法がわかりません。

Value over 50 million for a read-error rate, yet the test is good?!

たとえば、読み取りエラー率は5,000万を超えています(!)が、評価の評価は「良好」です。

これらのテストの結果(特に、正規化、最悪、しきい値、および値の数値)の解釈方法を説明してくれる人がいますか?そして、私がHDDで得た結果について彼らがどう思うか教えてください。 (ありがとう)

57
Marty

SMARTが wikipedia でどのように機能するかについての適切な説明があります。しかし、簡単な紹介:

  • 値:これは、コントローラーが報告する生の値です。通常、値は理解しやすい値です(時間単位の電力や温度など)が、そうでない場合もあります(読み取りエラー率など)。メーカーによって、このデータに異なる構造と意味を使用できます。

  • 正規化:これは正規化された上記の値であるため、値が大きいほど常に優れています。したがって、読み取り/エラー率の114は113よりも優れています。ここでも、ハードドライブが未加工データを正規化された値に変換する方法はベンダー固有です。

  • 最悪:ドライブが過去に持っていた最悪のnormalized値(99は工場出荷時の設定です)。

  • しきい値:normalized値がlowerこの値よりも小さい場合、ドライブは失敗する可能性があります。

したがって、ハードディスクは大丈夫のようです。読み取りエラー率の値は、ドライブが故障した回数ではなく、ディスクの製造元に依存する一部のデータ構造です。

52
Javier Rivera

はい、通常、読み取りエラー率の生の値はナンセンスです。監視したい値は、再割り当てされたセクター数、保留中の数、および修正不可能なオフラインです。それらは、修正されていない、修正されていない、または修正されていない不良セクタの数であり、そこにある生の値は一般的に意味があり、セクタの数です。

セクターの読み取りに失敗すると、保留になります。次回そのセクターに書き込もうとすると、ドライブはそれを書き直そうとします。それが機能する場合、すべてが正常に戻ります。セクタを正しく書き込めない場合は、スペアプールからセクタを再割り当てします。それができない場合(おそらく予備プールを使い果たしている可能性がありますか?)、それはちょうどoffline_uncorrectableになり、読み取りまたは書き込みを試みるとエラーになります。

25
psusi

psusiはそれを打ちます。

Seagate.comでデータシート(ホワイトペーパー)を読むと、HDDの作成方法、テスト方法、および実際の動作方法がわかります。完璧なHDDは存在せず、存在したことも、存在することもありません(歴史と事実)。昔は、新しいドライブボックスに入った紙のリストからHDDコントローラーに不良セクターを入力する必要があったため、コントローラーはそれらをスキップしました。

最新のドライブにはエラー修正機能があります。初日からセクターは悪いです。

したがって、彼らはそれらをマッピングします。これは、ドライブが不良セクタをスキップすることを意味します。実際、それらは「論理的にスワップアウト」されています-不良セクタは新しい、良好なスペアシリンダセクタにマッピングされます(スペアシリンダがあります-シリンダをトラックと考えてください)。これは、SMART utilを除いて、外界に対してすべて透過的です。

各メーカーは好きなようにできるので、ドライブが製造されるとすぐに10個の不良セクタがある場合でも、エラーカウントをゼロに設定する人もいます。

ドライブのファームウェアには3回のルールがあります-セクターを3回読み取り、3回すべてが悪い場合、その場で「再調整」を実行し、さらに3回読み取ります。それでもドライブが正常でない場合は、そのセクターをスペアセクターの1つにマップします。これはファームウェアの奥深くにありますが、バックグラウンドで継続的に発生し、すべてユーザーに対して透過的です。

製造業者は、3回の不正な読み取りがある場合、またはキャリブレーションがそれらに達した後、生のエラーを報告することを選択するかどうか。したがって、彼が上記で述べたように、同じ種類のドライブが多数あり、奇妙な傾向が見られない限り、それは重要ではありません。

ポイント2:すべてのHDDには自然な読み取りエラーがあります。必要に応じて、Seagateでも確認できます。しかし、それらはすべてその場でエラーが発生します。再度読み取られ、通常はCRCエラーのテストに合格します。そうでない場合、DRIVEはそれをスワップアウトしようとします。ディスクをクールに実行すると、長時間持続し、多くのユーザーがスペアシリンダーを使い果たすことはありません。しかし、psusiがあなたに言うようにそれを見てください!

私はこれを、これまでに作った最初の1GB HDDの1つを実行している古いPCでタイプしています。そしてまだ良いです。 (バックアップ済み)(冷却の不足はありません...)熱が一番のキラーであり、電力サージです。UPSを実行しています。乾杯と良い一日。これがお役に立てば幸いです。 (これまでにDatA Generalハードディスクのクラッシュを見たことがありますか?かつては膨大な量のアルミニウムウール、巻き毛の手がかりで部屋を満たしていましたか?.

9
jtgh