web-dev-qa-db-ja.com

ブリッジおよびボンディングされたインターフェースの不安定性

私は昨日投稿して、仮想マシン(KVM/libvirt)に使用されるいくつかのブリッジインターフェースを使用して動作するセットアップを取得しました。

ブリッジインターフェイスの1つはポートとしてeth3を使用し、2番目のインターフェイス(パブリックトラフィック)はイーサネットボンディングインターフェイスを使用しています。

そのセットアップは機能していますが、常にではありません! VMからダウンロードを開始すると、停止してフリーズします。

ブリッジパラメータが正しいかどうかわかりません。以下の設定を確認してください。

iface eth3 inet manual

auto bond0
iface bond0 inet manual
    slaves eth1 eth2
    pre-up ip link set bond0 up
    down ip link set bond0 down

auto br0
iface br0 inet static
    address 10.160.0.7
    netmask 255.255.255.128
    bridge_ports eth3
    bridge_fd 9
    bridge_hello 2
    bridge_maxage 12
    bridge_stp on

auto br0:1
iface br0:1 inet static
    address 10.160.0.9
    netmask 255.255.255.255

auto br0:2
iface br0:2 inet static
    address 10.160.0.10
    netmask 255.255.255.255

auto br1
iface br1 inet static
    address 217.4.40.242
    netmask 255.255.255.240
    gateway 217.4.40.241
    pre-up /etc/network/firewall start
    bridge_ports bond0
    bridge_fd 9
    bridge_hello 2
    bridge_maxage 12
    bridge_stp on

auto br1:1
iface br1:1 inet static
    address 217.4.40.252
    netmask 255.255.255.255

auto br1:2
iface br1:2 inet static
    address 217.4.40.253
    netmask 255.255.255.255

そして、はい、それはまた時々ホスト上の火星について話します:

kernel: [249146.055172] martian source 10.160.0.17 from 10.160.0.10, on dev vnet2
kernel: [249146.073122] ll header: ff:ff:ff:ff:ff:ff:54:52:00:76:c3:5c:08:06

私が直面している問題のように聞こえます。
これは、KVMのブリッジボンディング構成のWORKING構成の例ですが、同時に使用するインターフェースは1つだけです。多分それはスイッチに依存します(PlanetGSD-802SとHPV1910を使用)。私はこれを2つの場所で使用しています(ハードウェアとスイッチが異なります)。

cat /etc/modprobe.d/bonding.conf
alias bond0 bonding
options bonding mode=802.3ad miimon=100 downdelay=200 updelay=200 ad_select=0 lacp_rate=fast

cat/etc/network/interfaces
auto lo
iface lo inet loopback

The bonded network interface

auto bond0
iface bond0 inet manual
bond-slaves none
bond-mode 802.3ad
bond-miimon 100
bond_lacp_rate fast
bond_ad_select 0
up /sbin/ifenslave bond0 eth1 eth2
down /sbin/ifenslave bond0 -d eth1 eth2

Enslave all the physical interfaces

Card #1 Nvidia Gigabit onboard

auto eth1
iface eth1 inet manual
bond-master bond0

Card #2 Intel PRO/1000 F Server Adapter - FIBER

auto eth2
iface eth2 inet manual
bond-master bond0

Bridge to LAN for virtual network KVM

auto br0
iface br0 inet static
address 10.0.0.254
netmask 255.255.255.0
network 10.0.0.0
broadcast 10.0.0.255
gateway 10.0.0.1
dns-nameservers 10.0.0.1 8.8.8.8
bridge-ports bond0
bridge-fd 9
bridge-hello 2
bridge-maxage 12
bridge-stp off

Card #3 - Internet modem

auto eth0
iface eth0 inet manual

Bridge for virtual network KVM - modem

iface br1 inet manual
bridge_ports eth0
bridge_stp off
bridge_fd 0
bridge_maxwait 0
metric 1
auto br1

2
TooMeeK

Pre-up/down属性は不要であり、arpリンクの監視をオンにする必要があるという事実を除けば、そのボンドの構成は問題ないように見えます。ただし、エイリアスインターフェイスにネットマスクを設定しないでください。カーネルにネットマスクを正しく設定させてください(メインIPのネットマスクと同じである必要があります-/ 32マスクが火星の問題の原因であると思います)。

ストールの前後にトラフィックのネットワークダンプがないと、原因を特定するのは困難です。問題を追跡するためのいくつかのアイデア:

  • ネットワークが小さなパケット(pingなど)で機能することを確認します
  • 問題が一貫して再現可能であることを確認します(VMからダウンロードしようとするたびに発生しますか?)
  • 結合を取り除き、それがまだ再現可能かどうかを確認します(そうでない場合は、結合に問題がある可能性があります)
  • ホストマシンで同じダウンロードを行うと問題が発生しますか? (そうでない場合、問題は債券にありません)
  • MTUをVMのNICにドロップしてみてください。ホスト構成に問題の原因となるものは何も表示されませんが、他のネットワークデバイスに問題がある可能性があります。
1
womble

スパニングツリーを有効にしている理由はありますか?外部セグメント間に何らかの冗長接続を提供している場合を除き、それは必要ではなく、トラフィックをブロックしたり、アップストリームスイッチがポートを一時的にシャットダウンしたりする可能性があります。

0
rnxrx

実際には答えませんが、「私も」+回避策:Dell poweredge2950のBroadcomのBCM5708NICで同様の問題が発生しました。私の場合、ボンディング+ VLANのみがあり、ブリッジはありませんでした。ホストを実行して数日後、インターネットアクセスが失われていました。トラブルシューティングのオプションがあまりなく、イーサネットカードを追加することになりました。これで、オンボードカードとアドオンカード間の結合が正常に機能します。

0
pQd