web-dev-qa-db-ja.com

igbがTxユニットのハングを検出

持っている:

lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 14.04.3 LTS
Release: 14.04
Codename: trusty

カーネル3.16.0-46-genericを使用。

今日、dist-upgradeを実行し、カーネルを3.16.0-48-genericバージョンにアップグレードしました。

再起動後、私はこれを持っています:

Sep 4 09:02:52 mail kernel: [ 310.616324] igb 0000:02:00.0 em1: Reset adapter
Sep 4 09:02:52 mail kernel: [ 310.831157] igb 0000:02:00.1 em2: Reset adapter 
Sep 4 09:02:56 mail kernel: [ 315.154686] igb 0000:02:00.0 em1: igb: em1 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX 
Sep 4 09:02:56 mail kernel: [ 315.202651] igb 0000:02:00.1 em2: igb: em2 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX 
Sep 4 09:03:02 mail kernel: [ 321.608099] igb 0000:02:00.0: Detected Tx Unit Hang
Sep 4 09:03:02 mail kernel: [ 321.608099] Tx Queue <6>
Sep 4 09:03:02 mail kernel: [ 321.608099] TDH <23>
Sep 4 09:03:02 mail kernel: [ 321.608099] TDT <23>
Sep 4 09:03:02 mail kernel: [ 321.608099] next_to_use <25>
Sep 4 09:03:02 mail kernel: [ 321.608099] next_to_clean <23>
Sep 4 09:03:02 mail kernel: [ 321.608099] buffer_info[next_to_clean]
Sep 4 09:03:02 mail kernel: [ 321.608099] time_stamp <1000012af>
Sep 4 09:03:02 mail kernel: [ 321.608099] next_to_watch <ffff880272571240>
Sep 4 09:03:02 mail kernel: [ 321.608099] jiffies <100001531>
Sep 4 09:03:02 mail kernel: [ 321.608099] desc.status <120200>
Sep 4 09:03:04 mail kernel: [ 323.607349] igb 0000:02:00.0: Detected Tx Unit Hang
Sep 4 09:03:04 mail kernel: [ 323.607349] Tx Queue <6>
Sep 4 09:03:04 mail kernel: [ 323.607349] TDH <23>
Sep 4 09:03:04 mail kernel: [ 323.607349] TDT <23>
Sep 4 09:03:04 mail kernel: [ 323.607349] next_to_use <25>
Sep 4 09:03:04 mail kernel: [ 323.607349] next_to_clean <23>
Sep 4 09:03:04 mail kernel: [ 323.607349] buffer_info[next_to_clean]
Sep 4 09:03:04 mail kernel: [ 323.607349] time_stamp <1000012af>
Sep 4 09:03:04 mail kernel: [ 323.607349] next_to_watch <ffff880272571240>
Sep 4 09:03:04 mail kernel: [ 323.607349] jiffies <100001725>
Sep 4 09:03:04 mail kernel: [ 323.607349] desc.status <120200>
Sep 4 09:03:06 mail kernel: [ 325.606602] igb 0000:02:00.0: Detected Tx Unit Hang
Sep 4 09:03:06 mail kernel: [ 325.606602] Tx Queue <6>
Sep 4 09:03:06 mail kernel: [ 325.606602] TDH <23>
Sep 4 09:03:06 mail kernel: [ 325.606602] TDT <23>
Sep 4 09:03:06 mail kernel: [ 325.606602] next_to_use <25>
Sep 4 09:03:06 mail kernel: [ 325.606602] next_to_clean <23>
Sep 4 09:03:06 mail kernel: [ 325.606602] buffer_info[next_to_clean]
Sep 4 09:03:06 mail kernel: [ 325.606602] time_stamp <1000012af>
Sep 4 09:03:06 mail kernel: [ 325.606602] next_to_watch <ffff880272571240>
Sep 4 09:03:06 mail kernel: [ 325.606602] jiffies <100001919>
Sep 4 09:03:06 mail kernel: [ 325.606602] desc.status <120200>

その後、すべてのネットワーク接続が切断されました。システムはまだ使用できません。

古いlinux-image-3.16.0-46-genericで起動した後にのみ、運用環境のメールサーバーが機能します。

それは私にとって重大なバグですが、誰か助けてくれますか?

ethtool -i em1
driver: igb
version: 5.2.13-k
firmware-version: 1.61, 0x80000cd5, 1.949.0
bus-info: 0000:02:00.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
supports-priv-flags: no
4
user369713

Ubuntu 14.04.3 LTSのクリーンインストールの場合のデフォルトである、新しい鮮やかなカーネルに切り替えることにしました。

Sudo apt-get install linux-signed-generic-lts-vivid

私の場合、原因はUEFI BIOSがあり、

Sudo apt-get install linux-generic-lts-vivid

レガシーBIOSの場合。

Utopicカーネルは削除できます。

2
user369713

3.16.0-48にアップグレードした後の同じ問題。

4個のIntel I350ギガビットイーサネットを搭載したIntel S2600GZ4サーバーを使用しています。この問題を解決するには、Grubに3.16.0-46を強制的に起動させる必要がありました。

[ 3187.380957] igb 0000:02:00.0 em1: Reset adapter
[ 3187.403245] igb 0000:02:00.2 em3: Reset adapter
[ 3187.403257] igb 0000:02:00.1 em2: Reset adapter
[ 3187.403259] igb 0000:02:00.3 em4: Reset adapter
[ 3188.858759] igb 0000:02:00.0 em1: igb: em1 NIC Link is Up 100 Mbps Full Duplex, Flow Control: None
[ 3190.295762] igb 0000:02:00.2 em3: igb: em3 NIC Link is Up 100 Mbps Full Duplex, Flow Control: RX/TX
[ 3190.754805] igb 0000:02:00.2 em3: igb: em3 NIC Link is Down
[ 3191.208233] igb 0000:02:00.3 em4: igb: em4 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 3191.728507] igb 0000:02:00.1 em2: igb: em2 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
[ 3194.365870] igb 0000:02:00.2 em3: igb: em3 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 3195.445233] igb 0000:02:00.3 em4: igb: em4 NIC Link is Down
[ 3196.189620] igb 0000:02:00.2 em3: igb: em3 NIC Link is Down
[ 3198.435979] igb 0000:02:00.3 em4: igb: em4 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 3199.641563] igb 0000:02:00.2 em3: igb: em3 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 3207.043242] igb 0000:02:00.3 em4: igb: em4 NIC Link is Down
[ 3209.384430] igb 0000:02:00.0: Detected Tx Unit Hang
[ 3209.384430]   Tx Queue             <2>
[ 3209.384430]   TDH                  <0>
[ 3209.384430]   TDT                  <0>
[ 3209.384430]   next_to_use          <2>
[ 3209.384430]   next_to_clean        <0>
[ 3209.384430] buffer_info[next_to_clean]
[ 3209.384430]   time_stamp           <1000b1520>
[ 3209.384430]   next_to_watch        <ffff880fe2f68010>
[ 3209.384430]   jiffies              <1000b177e>
[ 3209.384430]   desc.status          <528200>
[ 3210.514216] igb 0000:02:00.3 em4: igb: em4 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 3211.385464] igb 0000:02:00.0: Detected Tx Unit Hang
[ 3211.385464]   Tx Queue             <2>
[ 3211.385464]   TDH                  <0>
[ 3211.385464]   TDT                  <0>
[ 3211.385464]   next_to_use          <2>
[ 3211.385464]   next_to_clean        <0>
[ 3211.385464] buffer_info[next_to_clean]
[ 3211.385464]   time_stamp           <1000b1520>
[ 3211.385464]   next_to_watch        <ffff880fe2f68010>
[ 3211.385464]   jiffies              <1000b1972>
[ 3211.385464]   desc.status          <528200>
[ 3213.386510] igb 0000:02:00.0: Detected Tx Unit Hang
[ 3213.386510]   Tx Queue             <2>
[ 3213.386510]   TDH                  <0>
[ 3213.386510]   TDT                  <0>
[ 3213.386510]   next_to_use          <2>
[ 3213.386510]   next_to_clean        <0>
[ 3213.386510] buffer_info[next_to_clean]
[ 3213.386510]   time_stamp           <1000b1520>
[ 3213.386510]   next_to_watch        <ffff880fe2f68010>
[ 3213.386510]   jiffies              <1000b1b66>
[ 3213.386510]   desc.status          <528200>
[ 3214.386947] igb 0000:02:00.0 em1: Reset adapter
[ 3214.409233] igb 0000:02:00.2 em3: Reset adapter
[ 3214.409236] igb 0000:02:00.1 em2: Reset adapter
[ 3214.409237] igb 0000:02:00.3 em4: Reset adapter
[ 3215.844779] igb 0000:02:00.0 em1: igb: em1 NIC Link is Up 100 Mbps Full Duplex, Flow Control: None
[ 3217.918078] igb 0000:02:00.1 em2: igb: em2 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
[ 3218.255206] igb 0000:02:00.2 em3: igb: em3 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
[ 3218.366303] igb 0000:02:00.3 em4: igb: em4 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX

このスレッドに経験を追加して、より完全なものにします。

私の経験では、カーネル3.16.0-48にアップグレードした後にネットワークアダプターが事実上使用できなくなったのと同じです。 apt-get updateを完了することさえできませんでした。

このスレッド に従ってコマンドethtool -K eth0 gso off gro off tso offを実行しました。その後、apt-get upgradeを正常に完了して、Linuxテルネルを3.16.0-49にアップグレードしました。再起動後に問題はなくなりました。この時点でethtool -K eth0 gso off gro off tso offコマンドが役立ったかどうかはわかりません。

私の要点は、apt-get upgradeを完了していなくても、apt-get updateを実行できることです。

0
Samuel Li