XX地铁WLAN信号系统AP切换丢包问题


一、故障现象

每个车站一台S3600交换机,不同车站通过千兆链路互联。互联时,奇数车站交换机互联,偶数站交换机互联,互联方式如下图所示。轨旁AP采用交叉部署的方式与相邻两个车站交换机互联,列车上的AP在行车过程中与区间多个轨旁AP组成mesh链路进行车地通信,组网如下图所示。

  1.jpg

因为网络为列车CBTC行车专用,对带宽丢包率有严格要求。
Ø 当接收和发送200字节的报文时,无线应支持200kb/s的双向数据流量;
Ø 当列车以120km/s行驶时,数据丢失率应不超过1%;
Ø 通信时延要求小于500ms,链路切换小于50ms,连续丢包不能超过3个。

故障现象为列车AP下挂服务器PING核心交换机S7506下业务地址出现丢包现象,丢包时间大约为3s-5s,严重不满足客户要求。

二、故障分析流程

1、检查现网全部AP是否存在掉线;

2、检查RRPP环网是否正常,中间是否断开;

3、检查列车AP配置的被代理设备的mac-address、vlan、ip是否正确;

4、实时抓取列车行进过程中所有mesh链路的信息和相对应的时间记录;

5、实时抓取列车行进过程中车载AP设备空口利用率,检查是否存在信道干扰情况;

6、实时抓取列车行进过程中fping数据并记录时间戳判断丢包是否存在规律,确认丢包现象。

三、原因分析

1、通过查看APAC上的注册情况,发现“停车场”AP掉线;

2、通过查看RRPP环网状态,发现停车场交换机断电

3、通过分析mesh链路信息、空口利用率、fping丢包时间戳发现在车载AP切换mesh链路时造成3秒丢包。结合现场组网情况,核心交换机S7506分别从两个端口G2/0/1G2/0/2收到数据,导致核心交换机上记录的MAC地址与出端口的对应关系一直发生改变,但是核心交换机上的ARP表项不会立即更新,影响到数据业务的正常转发。

四、解决方法

丢包产生的根本原因在于网络对延迟要求较高,核心交换机S7506没有快速更新自己的ARP表项。

通过配置mac-address station-move quick-notify enable,此命令用来使能设备快速更新ARP表项功能,加快更新ARP表项的速度。

 


2018年06月