某运营商WLAN网络DHCP地址池耗尽告警解决案例
一、 组网情况介绍
某市运营商WLAN网络使用多台友商S9300作为核心层设备,S9300通过三层路由与多台H3C WX6108无线控制器互联,WX6108交换板通过背板万兆口与WX6108 AC板卡互联。 S9300下联多台汇聚设备,用户的DHCP服务器功能运行在WX6108上。
二、 故障描述
该运营商要求DHCP地址池的可用地址不应低于地址池总可用地址的10%,如果低于10%则网管系统告警。客户在每台AC下为用户DHCP地址池分配的均是32个C类地址,理论上每个地址池会有8000多个用户地址可用,每个用户的地址有效时间为1小时。近期网管软件经常出现可用地址低于10%告警,而在移动网管系统中DHCP地址池告警时查看该AC下关联的用户数也只有3000人左右,多数情况下用户数不足3000人,理论上地址池中可用地址是完全足够的,不应该出现可用地址低于10%告警。
三、 故障分析及排查
初步诊断是由于某些原因使用户解除无线关联1小时后用户占用的地址仍然没有被释放到DHCP地址池中,导致地址池占用率过高产生告警。通过命令display dhcp server free-ip 查看可用地址只有1000个左右,而在线用户数只有3000人,怀疑部分地址冲突无法作为有效地址使用。使用命令display dhcp server conflict查看冲突地址后发现有将近4000个冲突地址,由此可以判断出因为大量冲突地址占用地址池资源,使地址池中的可用地址不足10%导致网管系统告警。
经过查询相关资料后发现导致DHCP Server分配IP地址冲突的情况主要有两种,一是server每次分配IP地址都会发送一个ICMP报文,去探测网络中有没有PC使用这个IP地址,如果有,就记录一个冲突。二是有时候server的ICMP没有人应答,比如server和client不再同一个网络中。此时PC刚获取到这个IP地址,还会发送一个ARP去查看本网络内有没有人使用这个IP地址,如果有,就给server发送一个decline报文报文,server也将这个地址记录成冲突地址。结合运营商WLAN网络实际情况推断造成出现大规模冲突地址的主要原因可能为上述原因的第二种情况。
四、 故障解决
由于conflict冲突地址的计时器无法手动修改,而该计时器自动清除冲突地址的间隔较大无法满足运营商业务要求,只有通过手动输入命令reset dhcp server conflict来清除DHCP地址冲突信息,但运营商设备较多,每天输入命令会导致网络管理人员的工作量过大,因此可以将该条命令通过job计划每天来自动清除冲突的地址。
配置如下:
sys //进入系统视图
job reset dhcp conflict //新建计划任务名称reset dhcp conflic
view monitor //系统视图下执行
time 1 repeating at 05:00 command reset dhcp server conflict //每天5:00执行命令reset dhcp server conflict
保存退出即可,输入该命令后,系统将在每天凌晨五点自动执行一次该命令。
五、 效果反馈
在对该市运营商所有AC执行该命令后再未出现过地址池资源即将耗尽告警。
2015年01月
本期文章
-
公司动态
-
刊首语
-
行业聚集
-
产品推荐
-
案例介绍
-
经验共享
-
服务明星
-
培训天地