端口脱离聚合组问题处理

  1. 问题描述

  XX教育厅内网使用两台S12508作为核心层设备,两核心做IRF2堆叠。两台S5500刀片交换机作为服务器接入层设备,也做IRF2堆叠。网络拓扑如下:

  

图片11.png


  问题的具体现象是:刀片交换机一个端口(G1/1/1)脱离聚合组,导致部分业务故障。

  2. 信息收集

  1、 使用命令display link-aggregation summary与display link-aggregation verbose查询链路聚合组信息发现:刀片交换机本端G1/1/1端口脱离聚合组,而对端S12508的G1/2/0/25端口在聚合组内。

  S5500查看信息如下:

  [h3sa]display link-aggregation summary

  Aggregation Interface Type:

  BAGG -- Bridge-Aggregation, RAGG -- Route-Aggregation

  Aggregation Mode: S -- Static, D -- Dynamic

  Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing

  Actor System ID: 0x8000, 3822-d6b1-b32f

  AGG AGG Partner ID Select Unselect Share

  Interface Mode Ports Ports Type

  -------------------------------------------------------------------------------

  BAGG1 S none 3 0 Shar

  BAGG2 S none 4 0 Shar

  [h3sa]display link-aggregation verbose

  Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing

  Port Status: S -- Selected, U -- Unselected

  Flags: A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,

  D -- Synchronization, E -- Collecting, F -- Distributing,

  G -- Defaulted, H -- Expired

  Aggregation Interface: Bridge-Aggregation1

  Aggregation Mode: Static

  Loadsharing Type: Shar

  Port Status Oper-Key

  --------------------------------------------------------------------------------

  GE1/1/2 S 1

  GE2/1/2 S 1

  GE2/1/1 S 1

  Aggregation Interface: Bridge-Aggregation2

  Aggregation Mode: Static

  Loadsharing Type: Shar

  Port Status Oper-Key

  --------------------------------------------------------------------------------

  GE1/1/3 S 2

  GE1/1/4 S 2

  GE2/1/4 S 2

  GE2/1/3 S 2

  2、 使用命令display current-configuration interface加端口号查看相应端口下配置信息发现,刀片交换机G1/1/1端口与S12508交换机G1/2/0/25端口配置信息一样;

  3、 使用命令dis interface brief查看端口状态,刀片交换机G1/1/1端口状态正常;

  4、 使用命令display logbuffer收集日志信息,信息显示5月28日23:10刀片交换机G1/1/1端口脱离聚合组;

  5、 使用命令dis diagnostic-information收集设备统计信息。

  3. 问题分析及处理

  从收集到的信息分析,华三刀片交换机是纯二层设备,查看日志信息、聚合接口状态、聚合组中的端口状态及配置显示都正常,无法定位故障,收集信息反馈华三研发进行确认是否为设备硬件故障。

  下午,华三研发回复信息,让再次确认拓扑描述是否正确。我重新跟甲方网络工程师沟通后,确认S12508与刀片交换机之间是通过配线架进行互联的,把此信息反馈华三研发后,华三研发回复,需要把静态聚合修改为动态聚合。

  首先,我们看下不同聚合模式的特点如下:

  

图片12.png


  因为S5500(刀片交换机)与S12508都使用的静态聚合,当S5500的G1/1/1端口脱离聚合组时,S12508的G1/2/0/25端口仍然在聚合组里,并且认为G1/2/0/25可以进行数据负载,因此S12508通过G1/2/0/25端口返回数据丢失。主要的原因在于静态聚合模式不能根据对端状态(选中/非选中状态)而调整本端端口的状态(选中/非选中状态)。

  最后,配合用户把刀片交换机S5500与S12508的聚合模式修改为动态聚合后,业务恢复。

  4. 结束语

  通过本次故障处理有两点体会:第一,了解现场具体网络拓扑是排查故障的基础,非常重要;第二,知识必须灵活运用,要根据现场具体情况选择适合的聚合模式。


2016年01月