HDD S.M.A.R.Tの結果をどのように解釈しますか？

Question

最近、私のラップトップは少し信頼性が低くなり始め、何らかの理由で、HDDが故障し始めているのではないかと疑い始めました。インターネットで少し探した後、システムメニューでUbuntuのディスクユーティリティを見つけ、これから長いSMART診断を実行しました。

ただし、ディスクユーティリティのドキュメントは非常に貧弱（palimpsest？）であるため、結果の解釈方法がわかりません。

Value over 50 million for a read-error rate, yet the test is good?!

たとえば、読み取りエラー率は5,000万を超えています（！）が、評価の評価は「良好」です。

これらのテストの結果（特に、正規化、最悪、しきい値、および値の数値）の解釈方法を説明してくれる人がいますか？そして、私がHDDで得た結果について彼らがどう思うか教えてください。（ありがとう）

Javier Rivera · Accepted Answer

SMARTが wikipedia でどのように機能するかについての適切な説明があります。しかし、簡単な紹介：

値：これは、コントローラーが報告する生の値です。通常、値は理解しやすい値です（時間単位の電力や温度など）が、そうでない場合もあります（読み取りエラー率など）。メーカーによって、このデータに異なる構造と意味を使用できます。
正規化：これは正規化された上記の値であるため、値が大きいほど常に優れています。したがって、読み取り/エラー率の114は113よりも優れています。ここでも、ハードドライブが未加工データを正規化された値に変換する方法はベンダー固有です。
最悪：ドライブが過去に持っていた最悪のnormalized値（99は工場出荷時の設定です）。
しきい値：normalized値がlowerこの値よりも小さい場合、ドライブは失敗する可能性があります。

したがって、ハードディスクは大丈夫のようです。読み取りエラー率の値は、ドライブが故障した回数ではなく、ディスクの製造元に依存する一部のデータ構造です。

psusi · Answer

はい、通常、読み取りエラー率の生の値はナンセンスです。監視したい値は、再割り当てされたセクター数、保留中の数、および修正不可能なオフラインです。それらは、修正されていない、修正されていない、または修正されていない不良セクタの数であり、そこにある生の値は一般的に意味があり、セクタの数です。

セクターの読み取りに失敗すると、保留になります。次回そのセクターに書き込もうとすると、ドライブはそれを書き直そうとします。それが機能する場合、すべてが正常に戻ります。セクタを正しく書き込めない場合は、スペアプールからセクタを再割り当てします。それができない場合（おそらく予備プールを使い果たしている可能性がありますか？）、それはちょうどoffline_uncorrectableになり、読み取りまたは書き込みを試みるとエラーになります。

jtgh · Answer

psusiはそれを打ちます。

Seagate.comでデータシート（ホワイトペーパー）を読むと、HDDの作成方法、テスト方法、および実際の動作方法がわかります。完璧なHDDは存在せず、存在したことも、存在することもありません（歴史と事実）。昔は、新しいドライブボックスに入った紙のリストからHDDコントローラーに不良セクターを入力する必要があったため、コントローラーはそれらをスキップしました。

最新のドライブにはエラー修正機能があります。初日からセクターは悪いです。

したがって、彼らはそれらをマッピングします。これは、ドライブが不良セクタをスキップすることを意味します。実際、それらは「論理的にスワップアウト」されています-不良セクタは新しい、良好なスペアシリンダセクタにマッピングされます（スペアシリンダがあります-シリンダをトラックと考えてください）。これは、SMART utilを除いて、外界に対してすべて透過的です。

各メーカーは好きなようにできるので、ドライブが製造されるとすぐに10個の不良セクタがある場合でも、エラーカウントをゼロに設定する人もいます。

ドライブのファームウェアには3回のルールがあります-セクターを3回読み取り、3回すべてが悪い場合、その場で「再調整」を実行し、さらに3回読み取ります。それでもドライブが正常でない場合は、そのセクターをスペアセクターの1つにマップします。これはファームウェアの奥深くにありますが、バックグラウンドで継続的に発生し、すべてユーザーに対して透過的です。

製造業者は、3回の不正な読み取りがある場合、またはキャリブレーションがそれらに達した後、生のエラーを報告することを選択するかどうか。したがって、彼が上記で述べたように、同じ種類のドライブが多数あり、奇妙な傾向が見られない限り、それは重要ではありません。

ポイント2：すべてのHDDには自然な読み取りエラーがあります。必要に応じて、Seagateでも確認できます。しかし、それらはすべてその場でエラーが発生します。再度読み取られ、通常はCRCエラーのテストに合格します。そうでない場合、DRIVEはそれをスワップアウトしようとします。ディスクをクールに実行すると、長時間持続し、多くのユーザーがスペアシリンダーを使い果たすことはありません。しかし、psusiがあなたに言うようにそれを見てください！

私はこれを、これまでに作った最初の1GB HDDの1つを実行している古いPCでタイプしています。そしてまだ良いです。（バックアップ済み）（冷却の不足はありません...）熱が一番のキラーであり、電力サージです。UPSを実行しています。乾杯と良い一日。これがお役に立てば幸いです。（これまでにDatA Generalハードディスクのクラッシュを見たことがありますか？かつては膨大な量のアルミニウムウール、巻き毛の手がかりで部屋を満たしていましたか？.