CentOS 6.0 64ビットと2GB ECCメモリを実行するDell PowerEdge 840サーバーがあります。ユーザーがsshでログインすると、しばらくするとセッションが出力で終了します。
Corrupted MAC on input. Packet Corrupt
これは常に起こります。 sshセッションはしばらく動作する可能性がありますが、最終的には失敗します。 X-forwardingを使用している場合、より頻繁に発生することに気づきました。
グーグル の回答の後、サーバーにハードウェアの問題(おそらくメモリ)があると思います。 lshw(メモリ)からの出力。
capabilities: internal write-back unified
*-memory
description: System Memory
physical id: 1000
slot: System board or motherboard
size: 2GiB
*-bank:0
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 0
serial: 09022F17
slot: DIMM1_A
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
*-bank:1
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 1
serial: 09022E13
slot: DIMM1_B
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
*-bank:2
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 2
serial: 09030910
slot: DIMM2_A
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
*-bank:3
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 3
serial: 09030B13
slot: DIMM2_B
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
Memtest86 +を実行したところ、エラーは返されませんでした。また、メモリを取り付け直し、メモリモジュールを別のスロットに移動し、さらにスワップ領域を4GBに増やしました。サーバーは、さまざまなポートで(ソースからコンパイルされた)事前設定されたApacheサーバーを実行するテストサーバーです。各開発者は独自のhttpd.confおよびテスト環境を持っているため、複数のApacheサーバーが実行されている可能性があります。
また、syslogでエラーメッセージを確認しましたが、興味深いものは見つかりませんでした。最小限のメモリ使用量でサーバーの使用を停止するように全員に要求した後でも、同じエラーメッセージが表示され、上で指摘したエラーメッセージでsshセッションが終了します。
トラブルシューティングの次のステップは何ですか?
Sendmoreinfoに感謝します。
TCPチェックサムが原因であるようです。無効にしたTCPチェックサムオフロード:
ethtool -K eth0 tx off rx off
そして、それは再び働き始めました。
「入力時に破損したMAC。Linuxサーバー上のSSH、SCP、およびFTPを介したファイル転送でパケットが破損しました」で推奨 、TCPオフロードが問題になる可能性があります。使用確認して設定するためのethtool.