私たちの環境ではLACP(モード4)ボンドを広く使用していますが、ケーブルが交差したり、スイッチポートが正しく構成されていなかったりして、LACPポートの状態が悪くなるという新しい展開で問題が発生することがあります。
トラブルシューティングに使用していることの1つは、パートナーのoperキーの値です。これらは一般的に一致する傾向があり、一致しない場合は、クロスケーブルの問題の可能性が疑われます。私はそれを研究しようとしていますが、決定的な答えを見つけるのに苦労しています。したがって、LACPチャネルグループ全体の操作キーが常に同じ操作キーを共有することを期待するのは合理的ですか、それとも正しく構成されたグループで異なる場合がありますか?
例えば:
# grep -A6 "partner lacp pdu" /proc/net/bonding/bond0
details partner lacp pdu:
system priority: 32768
system mac address: 70:e4:23:92:42:b7
oper key: 205
port priority: 32768
port number: 92
port state: 61
--
details partner lacp pdu:
system priority: 32768
system mac address: 70:e4:23:92:42:b7
oper key: 206
port priority: 32768
port number: 94
port state: 13
この例では、2番目のパートナーの状態が悪いことを知っています。私は、それが悪い「理由」を判断するための良い方法を考え出そうとしているだけです。
LACPモード4を使用して400台のサーバーにログインしました。2つのインターフェイス、25Gアップ/ダウンで合計50G。 2x Cisco 9600 LACPモード4をポートチャネルに設定して、両方のポートを結合します。 1本のケーブルを別のスイッチに接続して、電源、スイッチ、ケーブル、ラック、およびインターフェイスの冗長性を確保します。
オペラキーは全面的に同じです。
私は以下にワーキングボンドを含めています。
あなたの質問にはいくつかのことが思い浮かびますが、
トラブルシューティングに使用していることの1つは、パートナーのoperキーの値です。これらは一般的に一致する傾向があり、一致しない場合は、クロスケーブルの問題の可能性が疑われます。
これは、標準のケーブル配線方法を使用することで対処できます。ラックの左側を下るすべてのケーブルは、スイッチの左側に接続され(この場合、1つのラックが上になります)、右側を通るすべてのケーブルは、の右側に接続されます。スイッチ。つまり、サーバー1にはポート1またはポート48へのケーブルがあります。これは、カウントする標準モデルを作成するときに役立ちます。サーバー5はポート43とポート5になります。追跡と通信が簡単です。
別の考えとして、MACアドレスを使用してLACPメンバーを追跡します。 radssh + racadm(帯域外アクセス)またはradssh(sshを使用)を使用してサーバーにログインし、すべてのサーバーに一括ログインして、(bond0ではなく実際のメンバーが必要な)MACアドレスのリストを取得できます。完成したMACアドレスのリストをネットワークチームに渡し、メンバーのリストをMacアドレスのリストと比較します。
Sudo cat /etc/sysconfig/network-scripts/ifcfg-bond0
DEVICE=bond0
NAME=bond0
#NM_CONTROLLED=no
IPADDR=$SERVER_IP
PREFIX=22
GATEWAY=$GATEWAY_IP
ONBOOT=yes
BOOTPROTO=none
BONDING_OPTS="miimon=100 mode=4 lacp_rate=1 xmit_hash_policy=layer3+4"
Sudo cat /etc/sysconfig/network-scripts/ifcfg-enp10s0f0
DEVICE=enp10s0f0
TYPE="Ethernet"
BOOTPROTO="none"
ONBOOT="yes"
MASTER=bond0
SLAVE=yes
##HWADDR=<MAC>:2C:6C
#DEFROUTE="yes"
#PEERDNS="yes"
#PEERROUTES="yes"
IPV4_FAILURE_FATAL="no"
IPV6_FAILURE_FATAL="no"
NAME="enp10s0f0"
Sudo cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)
Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer3+4 (1)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0
802.3ad info
LACP rate: fast
Min links: 0
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 2
Number of ports: 2
Actor Key: 1
Partner Key: 32875
Partner Mac Address: <MAC>:be:03
Slave Interface: enp10s0f0
MII Status: up
Speed: 25000 Mbps
Duplex: full
Link Failure Count: 7
Permanent HW addr: <MAC>:ea:7c
Slave queue ID: 0
Aggregator ID: 2
Actor Churn State: none
Partner Churn State: none
Actor Churned Count: 6
Partner Churned Count: 6
details actor lacp pdu:
system priority: 65535
port key: 1
port priority: 255
port number: 1
port state: 63
details partner lacp pdu:
system priority: 32667
oper key: 32875
port priority: 32768
port number: 263
port state: 60
Slave Interface: p8p2
MII Status: up
Speed: 25000 Mbps
Duplex: full
Link Failure Count: 7
Permanent HW addr: <MAC>:ea:7d
Slave queue ID: 0
Aggregator ID: 2
Actor Churn State: none
Partner Churn State: none
Actor Churned Count: 5
Partner Churned Count: 5
details actor lacp pdu:
system priority: 65535
port key: 1
port priority: 255
port number: 2
port state: 63
details partner lacp pdu:
system priority: 32667
oper key: 32875
port priority: 32768
port number: 16647
port state: 60