今天遇到一个WLC的问题,在这里记录一下,进行了一些分析和判断,但不知道根本问题是什么,望有经验的伙伴儿更新补充一下,谢谢。
Hardware:AIR-CT8540-K9
Software:8.3.150
Deployment:standalone
故障现象:在WLC的msglog中能够看到如下的报错信息,伴随的现象是注册的AP都掉线了!!!
*broffu_SocketReceive: Jan 05 19:17:16.323: %DATAPLANE-3-DP_MSG: broffu_fp_dapi_cmd.c:4454 FP0.10:(1456)[cmdAddTun4:3558]failed to find ifIndex 5549
通过console接入到WLC之后,可以登录WLC的CLI界面,且简单做过了如下的检查和测试:
1.WLC上ping网关是可以通信的;
2.因为报错是ifindex相关的,所以检查了一下Port和dynamic interface,发现Port也是up的,dynamic interface也正常存在,可以和网关通信。
3.从报错的直观信息来看,粗略判断表面问题为:1)错误与添加 IPv4 隧道相关的命令或功能有关;2)指示系统尝试引用网络接口索引 (ifIndex),但无法找到它;3)这个报错应该是转发平面的。
4.而且在console到WLC观察一段时间之后,发现WLC间歇性地“疯狂”输出这些格式的报错log——“FP0.00:(xxxx)[cmdAddTun4:xxxx]failed to find ifIndex xxxx”。
尝试操作:
因为如上的现象,从个人的分析来说,大致表明系统正在尝试配置或更新capwap隧道 ,但找不到接口索引 (ifIndex) 。出现这种情况的原因可能是:
1.接口配置错误或丢失
从基本的情况来看,配置没有动过,且检查过配置情况,没有发生变化,接口和端口从show信息来看,无明显异常。
另外就是从硬件的情况判断,要么硬件的接口模块、光模块、光纤存在问题,但这个问题,我们通过更换光纤来进行了交叉测试,依然发生上面的报错,由于暂时没有光模块,所以没有进一步检查是否为光模块导致,但WLC的接口是LAG,两个接口都出现问题的概率较小;最后是接口模块问题,目前暂无明显的指向性信息。
2.数据平面或系统状态出现暂时性问题
如果是系统发生的短暂性的问题,应该快速恢复,或者在重启之后得到解决,而我们尝试过重启WLC,在重启WLC之后,观察几分钟依然有这样的报错情况出现,同时导致AP掉线。
3.配置不一致或 WLC 软件中存在错误
WLC的软件问题,的确有很大的可能性,但是如上所说,我们已重启过WLC,而且不止一次重启,每次重启后,发生的异常现象都是一样,没有变化。为了判断是否为版本问题,我们尝试将WLC升级到了8.5.182.0(因为现网还有AP1602/2602等AP),但是依然存在问题。
通过如上的分析,暂时只能判断这个和WLC的硬件转发平面问题存在较强的关系。
解决方案:
更换了一台WLC8540,因为之前已经将故障WLC升级到Release 8.5.182,部分AP已经同步了镜像,所以将更换的WLC也升级到了8.5.182,更换完成之后,AP全部上线,并观察了5个小时,没有发现AP掉线和WLC异常log的问题。
如果有任何人遇到了类似的问题,可以一起补充和讨论,谢谢 Thanks♪(・ω・)ノ
标签:AP,接口,问题,failed,报错,ifIndex,WLC,find From: https://blog.csdn.net/qq_22763255/article/details/145246248