某市公安局网络丢包故障处理
一. 【问题描述】
H3C S7503交换机通过引擎板上的千兆光口G0/0/1与思科CATALYST6000交换机GE6/4接口通过多模光纤直连,H3C7503做为二层接入设备下挂了多台数据库和应用服务器,思科CATALYST6000交换机做为服务器区的网关。
网络拓扑如下图所示:

问题的具体现象:从公安局内网PC访问H3C S7503交换机下的服务器,访问速度缓慢。在内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING,都出现了无规律的丢包现象,丢包率大概为20%。
【信息收集】
在H3C S7503交换机上查看引擎板上的G0/0/1端口,得到如下信息:
Port hardware type is 1000_BASE_MM_SFP
1000Mbps-speed mode, Full-duplex mode
Link speed type is autonegotiation, Link duplex type is force link
Input: 54555799 input errors, 0 runts, - giants, 0 throttles, 54555799 CRC
此接口工作在自动协商千兆速率、强制全双工状态,在接口入方向发现了大量的八位数级的输入和CRC校验错误信息。
查看思科CATALYST6000交换机与H3C S7503互联的千兆光口,得知此接口也工作在自动协商千兆速率、强制全双工状态。
三.【问题分析】
H3C S7503交换机和思科CATALYST6000交换机通过多模光纤跳线直连,且两台交换机互联的接口都工作在自动协商1000M、强制全双工状态,所以互联两台交换机的接口在协商速率和双工时没有出现问题。
从内网PC PING H3C S7503下的服务器丢包的可能原因如下:
1、 互联H3C S7503交换机和思科CATALYST6000交换机的接口的MTU值不匹配导致丢包。
2、 互联H3C S7503交换机和思科CATALYST6000交换机的接口的流量控制功能未开启,导致某一端的接口在接收对端设备发来的大量数据报文时处理能力不足,从而发生丢包故障。
3、 H3C S7503交换机或思科CATALYST6000交换机光模块问题;互联H3C S7503交换机和思科CATALYST6000交换机的光纤跳线问题;H3C S7503交换机或思科CATALYST6000交换机接口自身问题。
四.【处理方法】
为了避开两台交换机直连的状态,用一台华为交换机通过二层透传的方式做为中间设备来桥接H3C S7503交换机和思科CATALYST6000交换机。拓扑图如下:

排查步骤如下:
1、 查看H3C S7503交换机和思科CATALYST6000交换机的MTU值,得知两台交换机的MTU值相匹配,于是排除H3C S7503交换机和思科CATALYST6000交换机MTU值不匹配造成丢包的可能性。
2、 在两台交换机互联的接口上同时开启流量控制功能后,从内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING一段时间,依旧出现丢包现象,于是排除流控功能未开启导致丢包的可能性。
3、 更换互联H3C S7503交换机和思科CATALYST6000交换机的光跳线后,从内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING一段时间,依旧出现丢包现象,于是排除光跳线问题导致丢包的可能性。
4、 更换H3C S7503交换机引擎板上G0/0/1接口的光模块,从内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING一段时间,依旧出现丢包现象,接着更换思科CATALYST6000交换机GE6/4接口的光模块,从内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING一段时间,继续出现丢包现象,于是排除光模块问题导致丢包的可能性。
5、 将好的光模块插入引擎板上的非G0/0/1(其它千兆光口) 接口并与思科CATALYST6000交换机的GE6/4接口互联,从内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING一段时间,依旧出现丢包现象,于是使用H3C S7503交换机业务板的千兆电口与思科思科CATALYST6000交换机的GE6/4接口互联,接下来继续从内网PC上PING H3C S7503下的服务器以及在H3C S7503和思科CATALYST6000交换机之间互PING一段时间,不在发生丢包现象。
综合以上测试过程,得出H3C S7503交换机引擎板上千兆接口业务模块自身问题导致内网PC访问H3C S7503下的服务器丢包。
五.【结束语】
由于各种原因,网络中经常发生数据丢包的现象,希望大家从对这一案例的学习中能收获一些经验,那就是在分析丢包问题的时候,要考虑到导致丢包故障发生的各种可能原因,这样才能通过排除法来定位丢包发生的根本原因。
2016年01月
本期文章
-
刊首语
-
公司动态
-
行业聚焦
-
产品推荐
-
案例介绍
-
经验共享
-
服务明星
-
培训天地