web-dev-qa-db-ja.com

SMARTによると、ハードディスクは壊れていませんが、dmesgにエラーがあります

私のコンピューター(Debianを実行)の起動で奇妙な問題が発生することがあります。そこで「dmesg」コマンドを発行しました。その出力で私は多くのエラーを見ました。ただし、ハードディスクで([smartctl -t long/dev/sda]コマンドを使用して)拡張SMARTテストを実行すると、ディスクが破損していません。

これらのエラーの理由は何ですか?

ここにエラーがあります:

   (...)
      [  505.918537] ata3.00: exception Emask 0x50 SAct 0x400 SErr 0x280900 action 0x6 frozen
      [  505.918549] ata3.00: irq_stat 0x08000000, interface fatal error
      [  505.918558] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [  505.918566] ata3.00: failed command: READ FPDMA QUEUED
      [  505.918579] ata3.00: cmd 60/40:50:20:5b:60/00:00:0b:00:00/40 tag 10 ncq 32768 in
               res 40/00:54:20:5b:60/00:00:0b:00:00/40 Emask 0x50 (ATA bus error)
      [  505.918586] ata3.00: status: { DRDY }
      [  505.918595] ata3: hard resetting link
      [  506.410055] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [  506.422648] ata3.00: configured for UDMA/133
      [  506.422679] ata3: EH complete
      [ 1633.123880] md: bind<sdb3>
      [ 1633.187966] RAID1 conf printout:
      [ 1633.187977]  --- wd:1 rd:2
      [ 1633.187984]  disk 0, wo:0, o:1, dev:sda3
      [ 1633.187989]  disk 1, wo:1, o:1, dev:sdb3
      [ 1633.188866] md: recovery of RAID array md0
      [ 1633.188871] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
      [ 1633.188875] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
      [ 1633.188890] md: using 128k window, over a total of 1943618560k.
      [ 1634.167341] ata3.00: exception Emask 0x50 SAct 0x7f80 SErr 0x280900 action 0x6 frozen
      [ 1634.167353] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1634.167361] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1634.167369] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167382] ata3.00: cmd 60/00:38:00:00:6f/02:00:01:00:00/40 tag 7 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167389] ata3.00: status: { DRDY }
      [ 1634.167395] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167407] ata3.00: cmd 60/00:40:00:02:6f/02:00:01:00:00/40 tag 8 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167413] ata3.00: status: { DRDY }
      [ 1634.167418] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167429] ata3.00: cmd 60/00:48:00:04:6f/02:00:01:00:00/40 tag 9 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167435] ata3.00: status: { DRDY }
      [ 1634.167439] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167451] ata3.00: cmd 60/00:50:00:06:6f/02:00:01:00:00/40 tag 10 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167457] ata3.00: status: { DRDY }
      [ 1634.167462] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167473] ata3.00: cmd 60/00:58:00:08:6f/02:00:01:00:00/40 tag 11 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167479] ata3.00: status: { DRDY }
      [ 1634.167484] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167495] ata3.00: cmd 60/00:60:00:0a:6f/02:00:01:00:00/40 tag 12 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167500] ata3.00: status: { DRDY }
      [ 1634.167505] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167516] ata3.00: cmd 60/80:68:00:0c:6f/00:00:01:00:00/40 tag 13 ncq 65536 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167522] ata3.00: status: { DRDY }
      [ 1634.167527] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167538] ata3.00: cmd 60/00:70:80:0c:6f/02:00:01:00:00/40 tag 14 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167544] ata3.00: status: { DRDY }
      [ 1634.167553] ata3: hard resetting link
      [ 1634.658816] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1634.672645] ata3.00: configured for UDMA/133
      [ 1634.672696] ata3: EH complete
      [ 1637.687898] ata3.00: exception Emask 0x50 SAct 0x3ff000 SErr 0x280900 action 0x6 frozen
      [ 1637.687910] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1637.687918] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1637.687926] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687940] ata3.00: cmd 60/00:60:80:a7:af/02:00:02:00:00/40 tag 12 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687947] ata3.00: status: { DRDY }
      [ 1637.687953] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687965] ata3.00: cmd 60/00:68:80:a9:af/02:00:02:00:00/40 tag 13 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687971] ata3.00: status: { DRDY }
      [ 1637.687976] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687987] ata3.00: cmd 60/80:70:80:ab:af/01:00:02:00:00/40 tag 14 ncq 196608 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687993] ata3.00: status: { DRDY }
      [ 1637.687998] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688009] ata3.00: cmd 60/00:78:00:ad:af/02:00:02:00:00/40 tag 15 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688015] ata3.00: status: { DRDY }
      [ 1637.688020] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688031] ata3.00: cmd 60/80:80:00:af:af/00:00:02:00:00/40 tag 16 ncq 65536 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688037] ata3.00: status: { DRDY }
      [ 1637.688042] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688053] ata3.00: cmd 60/00:88:80:af:af/01:00:02:00:00/40 tag 17 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688059] ata3.00: status: { DRDY }
      [ 1637.688064] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688075] ata3.00: cmd 60/80:90:80:b0:af/00:00:02:00:00/40 tag 18 ncq 65536 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688081] ata3.00: status: { DRDY }
      [ 1637.688085] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688096] ata3.00: cmd 60/00:98:00:b1:af/02:00:02:00:00/40 tag 19 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688102] ata3.00: status: { DRDY }
      [ 1637.688107] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688118] ata3.00: cmd 60/00:a0:00:b3:af/01:00:02:00:00/40 tag 20 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688124] ata3.00: status: { DRDY }
      [ 1637.688129] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688140] ata3.00: cmd 60/00:a8:00:b4:af/01:00:02:00:00/40 tag 21 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688146] ata3.00: status: { DRDY }
      [ 1637.688154] ata3: hard resetting link
      [ 1638.179398] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1638.192977] ata3.00: configured for UDMA/133
      [ 1638.193029] ata3: EH complete
      [ 1640.259492] md: export_rdev(sdb1)
      [ 1640.326109] md: bind<sdb1>
      [ 1640.346712] RAID1 conf printout:
      [ 1640.346724]  --- wd:1 rd:2
      [ 1640.346731]  disk 0, wo:0, o:1, dev:sda1
      [ 1640.346736]  disk 1, wo:1, o:1, dev:sdb1
      [ 1640.346893] md: delaying recovery of md1 until md0 has finished (they share one or more physical units)
      [ 1657.987964] ata3.00: exception Emask 0x50 SAct 0x40000 SErr 0x280900 action 0x6 frozen
      [ 1657.987975] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1657.987984] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1657.987992] ata3.00: failed command: READ FPDMA QUEUED
      [ 1657.988006] ata3.00: cmd 60/00:90:00:30:2e/03:00:09:00:00/40 tag 18 ncq 393216 in
               res 40/00:94:00:30:2e/00:00:09:00:00/40 Emask 0x50 (ATA bus error)
      [ 1657.988013] ata3.00: status: { DRDY }
      [ 1657.988022] ata3: hard resetting link
      [ 1658.479548] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1658.493107] ata3.00: configured for UDMA/133
      [ 1658.493147] ata3: EH complete
      [ 1670.547791] ata3: limiting SATA link speed to 1.5 Gbps
      [ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
      [ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547846] ata3.00: status: { DRDY }
      [ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547863] ata3.00: cmd 60/80:08:80:20:2e/00:00:0c:00:00/40 tag 1 ncq 65536 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547869] ata3.00: status: { DRDY }
      [ 1670.547875] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547886] ata3.00: cmd 60/00:10:00:21:2e/02:00:0c:00:00/40 tag 2 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547892] ata3.00: status: { DRDY }
      [ 1670.547896] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547907] ata3.00: cmd 60/00:18:00:23:2e/02:00:0c:00:00/40 tag 3 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547913] ata3.00: status: { DRDY }
      [ 1670.547918] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547929] ata3.00: cmd 60/00:20:00:25:2e/01:00:0c:00:00/40 tag 4 ncq 131072 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547935] ata3.00: status: { DRDY }
      [ 1670.547940] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547951] ata3.00: cmd 60/00:28:00:26:2e/02:00:0c:00:00/40 tag 5 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547957] ata3.00: status: { DRDY }
      [ 1670.547961] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547972] ata3.00: cmd 60/00:30:00:28:2e/02:00:0c:00:00/40 tag 6 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547978] ata3.00: status: { DRDY }
      [ 1670.547987] ata3: hard resetting link
      [ 1671.039264] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
      [ 1671.053386] ata3.00: configured for UDMA/133
      [ 1671.053444] ata3: EH complete
      [ 2422.512002] md: md0: recovery done.
      [ 2422.547344] md: recovery of RAID array md1
      [ 2422.547355] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
      [ 2422.547360] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
      [ 2422.547378] md: using 128k window, over a total of 4877312k.
      [ 2422.668465] RAID1 conf printout:
      [ 2422.668474]  --- wd:2 rd:2
      [ 2422.668480]  disk 0, wo:0, o:1, dev:sda3
      [ 2422.668486]  disk 1, wo:0, o:1, dev:sdb3
      [ 2469.990451] md: md1: recovery done.
      [ 2470.049986] RAID1 conf printout:
      [ 2470.049997]  --- wd:2 rd:2
      [ 2470.050003]  disk 0, wo:0, o:1, dev:sda1
      [ 2470.050009]  disk 1, wo:0, o:1, dev:sdb1
      [ 3304.445149] PM: Hibernation mode set to 'platform'
      [ 3304.782375] PM: Syncing filesystems ... done.
      [ 3307.028591] Freezing user space processes ... (elapsed 0.001 seconds) done.
      (...)
13
user983447

まず、SMARTがドライブが正常であると言っても、必ずしもドライブがis正常であるとは限らないことに注意してください。= SMARTレポートはaidであり、絶対的な真実ではありません。

興味があるのは、理由ではなく、何をすべきかだけの場合は、最後の数段落まで自由にスクロールしてください。ただし、暫定テキストは、私が提案することが正しい行動方針であると私が考える理由、および投稿した内容からそれを導き出す方法を説明します。

それでは、これらのエラーの1つが何を示しているかを見てみましょう。

[ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
[ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
           res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547846] ata3.00: status: { DRDY }
[ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED

(私は一緒に行くべき部品を手に入れたいと思っていますが、あなたはそれらのバンドルを手に入れていたので、どちらの方法でも大丈夫です。)

Linux ata Wikiには、これらのエラーの読み方を説明するページがあります 。特に、

  • statusの値がDRDYの場合は、「デバイスの準備が整っています。通常は1で、すべてが正常です。」 DRDYのステータス値を表示することは完全に正常であり、予期されることです。
  • SErrorには複数のコンポーネント値があり、その値が(この特定のスニペットで)表示されています:
    • UnrecovData "データ整合性エラーが発生しました、インターフェイスは回復しませんでした"
    • HostInt "ホストバスアダプターの内部エラー"
    • 10B8B "10bから8bへのデコードエラーが発生しました"
    • BadCRC "リンク層のCRCエラーが発生しました"

信号の同期とエラー検出の両方を支援するために8ビットを10ビットとしてエンコードする10b8bコーディングは、必ずしもドライブ自体ではなく、物理ケーブルで使用されます。ドライブは他の形式のFECまたはECCコーディングを使用している可能性が高く、エラーは通常、何らかの形式のI/Oエラーとして表示され、おそらくerrorの値がUNC(「訂正不可能なエラー-多くの場合、ディスク上の不良セクターが原因」)、おそらくresの末尾に括弧で囲まれた「メディアエラー」(「ソフトウェアがメディアエラーを検出しました」)この後者はあなたが見ているものではないので、完全に除外することはできませんが、それはありそうにありません。

「リンク層」は、ドライブ自体のコントローラーとディスクドライブインターフェイスチップ(コンピューターのマザーボード上の southbridge の一部である可能性が高い)間の物理的なケーブルと回路基板のトレースですが、オフボードに配置することもできます。 HBA)。

HBAとも呼ばれるホストバスアダプターは、ストレージ機器に接続する回路です。通称「ディスクコントローラー」とも呼ばれます。この用語は、最近のシステムでは少し誤った名称になっています。 HBAの最も目に見える部分は一般に接続ポートであり、最近のほとんどの場合、SATAまたは一部のSASフォームファクターです。

UnrecovDataフラグとHostIntフラグは、基本的に「何かがひどく間違っており、回復する方法がなかったか、回復の試みが行われなかった」ことを示しています。逆はおそらくRecovDataであり、「データ整合性エラーは発生しましたが、インターフェイスは回復しました」ということを示しています。 (余談ですが、「ホスト」はシステム全体ではなくHBAを指すため、HBAIntではなくHostIntを使用したでしょう。)

10B8BBadCRCの組み合わせはどちらも物理リンク層を指しているため、ケーブル配線の問題が疑われます。

この疑いは、SMARTセルフテストはステータスレポートを除いて完全にドライブの内部テストであり、製造元がレポートを正当化するのに十分深刻であると感じるエラーを検出していないという事実によってもサポートされています。ドライブがデータの保存または読み取りに問題を抱えていた場合、特に長いSMARTセルフテストで報告されているはずです。

TL; DR:

したがって、私が最初に行うことは、両端のSATAケーブルを取り外して再度差し込むことです少し緩んでいて、ケーブルが失われる可能性があります断続的に電気的接触。それで問題が解決するかどうかを確認します。影響を受けるディスクだけでなく、コンピュータのすべてのSATAケーブルにこれを行う価値さえあるかもしれません。オフボードHBAを使用している場合は、そのカードを取り外して装着し直します。これは、すでにケーブルをいじっているときに試すのが簡単だからです。

それができない場合は、SATAケーブルを捨てて、できれば高品質のケーブルに交換してください。高品質のケーブルは少し高価になりますが、このような頭痛の種を避けるのに役立つなら、通常は少額の追加費用に見合うだけの価値があると思います。ストレージの噴出エラーを見るのが好きな人はいません!

22
a CVn

私の場合、2つのディスクコントローラーに2つのディスクを接続していることに気付きました。1つ目はPCI-Express、2つ目は通常のPCIです。同じコントローラに両方のRAIDディスクを接続すると、BadCRCエラーがなくなりました。

0
PHZ.fi-Pharazon