Wlan AP闪断问题处理

  一. 【问题描述】

  某市WLAN网络使用两台S9300作为核心层设备,S9300通过三层路由与两台WX6108的交换板互联,WX6108交换板通过万兆口与WX6108 AC板卡互联,WX6108-1为主机,WX6108-2为备机。S9300下联多台汇聚设备。网络拓扑如下图所示:

  

blob.png


  问题的具体现象是:AC上大量AP出现闪断情况,掉线AP在1-5分钟之内恢复。

  二. 【信息收集】

  1. 收集掉线AP的信息,如掉线时间、掉线恢复时间、掉线AP的安装位置。

  2. 从AC板PING掉线AP的IP地址查看是否丢包。

  3. 查看93的路由表(包括静态和动态)。

  4. 查看93的MAC地址表项。

  5. 查看汇聚设备的LOG日志。

  6. 收集AP的在线时长和LOG日志。

  三. 【问题分析】

  1. 从收集到的AP信息来看,AP是否都集中在同一个区域或者同一个交换设备下,通过分析所得到的信息,闪断AP的分布并不集中,排除此项。

  2. 从PING结果查看并没有丢包现象,排除丢包导致AP重启原因。

  3. 查看93的路由表是否存在路由重新计算导致的路由震荡,通过查看并无此原因。

  4. 查看93的MAC地址表项,排除因MAC地址已满导致AP分不到地址情况。

  5. 查看汇聚LOG日志,排除因停电导致POE供电设备重启导致AP重启情况。

  6. 查看AP的在线时长与AC上AP的在线时长比较,确实存在AP重启情况,查看LOG日志也存在重启情况。

  7. 排除以上原因,通过在次分析所收集到的AP信息,得到闪断情况大部分集中在晚上7点半到10点之间,可以得到信息:用户使用高峰时段容易出现闪断情况。

  8. 在用户使用高峰时段登录AC进行观察,发现用户大量登录,流量增加较大,观察端口利用率达到60%左右,此时查看93的端口利用率发现接近饱和,找到AP闪断原因。

  四. 【处理方法】

  1. 对93与汇聚的链路带宽进行扩容。

  2. 对AC与93间的链路带宽进行扩容。

  五. 【结束语】

  链路带宽扩容后,AP闪断情况不在出现,保障了AP到AC之间的通信,增强了网络健壮性。该类故障提醒我们在新用户大量增加的情况下,要及时更新原有的网络硬件以适应新的情况,避免因硬件落后影响有网络的稳定性。


2016年01月