web-dev-qa-db-ja.com

SSHセッションが突然終了し、次のメッセージが表示されます:入力時にMACが破損しています。切断:パケットが破損しています

CentOS 6.0 64ビットと2GB ECCメモリを実行するDell PowerEdge 840サーバーがあります。ユーザーがsshでログインすると、しばらくするとセッションが出力で終了します。

Corrupted MAC on input. Packet Corrupt

これは常に起こります。 sshセッションはしばらく動作する可能性がありますが、最終的には失敗します。 X-forwardingを使用している場合、より頻繁に発生することに気づきました。

グーグル の回答の後、サーバーにハードウェアの問題(おそらくメモリ)があると思います。 lshw(メモリ)からの出力。

          capabilities: internal write-back unified
 *-memory
      description: System Memory
      physical id: 1000
      slot: System board or motherboard
      size: 2GiB
    *-bank:0
         description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
         product: 72T64000HU3SB
         vendor: 7F7F7F7F7F510000
         physical id: 0
         serial: 09022F17
         slot: DIMM1_A
         size: 512MiB
         width: 64 bits
         clock: 667MHz (1.5ns)
    *-bank:1
         description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
         product: 72T64000HU3SB
         vendor: 7F7F7F7F7F510000
         physical id: 1
         serial: 09022E13
         slot: DIMM1_B
         size: 512MiB
         width: 64 bits
         clock: 667MHz (1.5ns)
    *-bank:2
         description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
         product: 72T64000HU3SB
         vendor: 7F7F7F7F7F510000
         physical id: 2
         serial: 09030910
         slot: DIMM2_A
         size: 512MiB
         width: 64 bits
         clock: 667MHz (1.5ns)
    *-bank:3
         description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
         product: 72T64000HU3SB
         vendor: 7F7F7F7F7F510000
         physical id: 3
         serial: 09030B13
         slot: DIMM2_B
         size: 512MiB
         width: 64 bits
         clock: 667MHz (1.5ns)

Memtest86 +を実行したところ、エラーは返されませんでした。また、メモリを取り付け直し、メモリモジュールを別のスロットに移動し、さらにスワップ領域を4GBに増やしました。サーバーは、さまざまなポートで(ソースからコンパイルされた)事前設定されたApacheサーバーを実行するテストサーバーです。各開発者は独自のhttpd.confおよびテスト環境を持っているため、複数のApacheサーバーが実行されている可能性があります。

また、syslogでエラーメッセージを確認しましたが、興味深いものは見つかりませんでした。最小限のメモリ使用量でサーバーの使用を停止するように全員に要求した後でも、同じエラーメッセージが表示され、上で指摘したエラーメッセージでsshセッションが終了します。

トラブルシューティングの次のステップは何ですか?

7
rchhe

Sendmoreinfoに感謝します。

TCPチェックサムが原因であるようです。無効にしたTCPチェックサムオフロード:

ethtool -K eth0 tx off rx off 

そして、それは再び働き始めました。

14
rchhe

「入力時に破損したMAC。Linuxサーバー上のSSH、SCP、およびFTPを介したファイル転送でパケットが破損しました」で推奨 、TCPオフロードが問題になる可能性があります。使用確認して設定するためのethtool.

4
sendmoreinfo