iNode拨号失败故障分析及网路优化

一、问题描述

问题的具体现象是:日前有少量用户报拨号失败故障,在IMC平台上有很多账号报用户正在认证故障,一线人员报3600系列交换机多台报CPU使用率过高。

二、原因分析

故障原因分析:通过分析从设备上抓取的信息,发现有一个MAC为4437-E620-5E8B、IP为192.168.100.1的PC机频繁发送大量DHCP广播报文。此类报文被大量的上送给交换机的CPU,并造成交换机CPU过高,从而影响了交换机的正常工作。

三、解决方案

1、下次CPU温度过高时,马上关掉MAC为4437-E620-5E8B的PC机所连交换机的端口。

2、针对网络实际情况,给出网络优化方案。

四、故障排除及常用优化措施

1、网络优化部分

1.1 过滤vrrp报文上cpu

命令:[H3C]system-guard transparent vrrp 

1.2 优化过路子网广播报文上cpu

命令:[H3C]system-guard transparent ip-broadcast 192.168.1.255 24

1.3 优化过路ospf报文上cpu

命令:[H3C]system-guard transparent  ospf

2、故障信息收集部分

2.1关于cpu 高收集信息方案如下:

dis cpu  

注释:显示cpu信息,查看哪个unit的CPU占有率高,然后把串口插到CPU高的unit上,开始收集信息。

sys      \\进入系统视图

_h        \\进入隐藏视图

dis cpu

dis stp tc

dis irf s

dis drv ni

dis reserved-memory sec 0 cpuhigh

 

quit     \\在隐藏视图下连续收集两次,退到用户视图。

ter  deb

ter  mon

debugging drv packet drvrcv

收集一分钟上cpu报文

und  ter  deb

undo debug all

2.2 认证方面收集信息

当有用户离线时,进行如下信息采集。

1、打开接入设备的debug 命令:

   用户试图下:debugging dot1x all

               debugging radius packet

               ter deb

               ter mon

    抓取整个认证过程的debug后关闭debug开关。          

2、利用端口镜像抓取接入设备上行端口的认证信息,并在直连pc上面抓取认证报文(使用测试账号),需要有用户进行认证,将认证失败过程都抓取下来,收集报文数据及设备上面debug信息。

镜像的配置:

进入镜像源端口,配置镜像源端口,如E1/0/1口:

[H3C]interface Ethernet1/0/1

[H3C-Ethernet1/0/1]mirroring-port both 

进入镜像目的端口,配置镜像目的端口,如E1/0/2口:

[H3C]interface Ethernet1/0/2

[H3C-Ethernet1/0/2]monitor-port 

3、同时查看之前用户离线在IMC上的离线原因。

4、在故障时,在接入交换机上ping imc地址,看看是否有丢包。

5、反馈测试时pc的mac ,ip ,用户名,所接的端口号。

 

 


2017年11月