- 电源故障
1.故障描述:
电源在不同的设备上是不同的,分为非集成(可插拔)与集成(不可插拔)两种,如遇不可插拔,请整机更换
2.故障判断:
(1)指示灯异常
(2)登录设备通过命令display power 出现:
Power 1 State: Normal
Power 2 State: fault
Power 2的现象时就确定为电源故障。
(3)登录设备通过命令display logbuffer 出现:
DEV/5/DEV_LOG: Power 2 failed
DEV/2/POWER STATE CHANGE TO FAILURE: Trap 1.3.6.1.4.1.2011.2.23.1.12.1.1: power ID is 2
3.解决办法:
(1)首先重新插拔故障电源模块,看是否能恢复,不能恢复就直接更换电源模块。
(2)首先关闭电源,拆除电源线。
(3)佩戴放静电腕带,用螺丝刀拧松固定电源模块的螺丝。
(4)用一只手拉住电源模块上的拉手,将电源模块拉出来一部分,然后另一只手托住电源模块下方,将电源模块缓慢拉出。
(5)将拆卸下来的电源模块放置到防静电垫子上。
(6)取出新电源模块(确定好电源模块与设备所需的型号一致)。
(7)保证电源模块上下方向正确,用一只手抓住电源模块的拉手,另一只手托住电源模块的底部,将其后端对准电源插槽。
(8)将电源模块沿着电源插槽导轨,水平插入插槽,直到电源模块后端与背板插口良好接触。
(9)用螺丝刀拧紧固定电源模块的螺丝。
(10)来接电源线,开启电源。
(11)更换下来的坏件放入坏件库。
4.注意事项:
(1)插入过程中,必须借助轻微的惯性将电源模块适配器插入机箱。
(2)为了避免损坏电源模块适配器和背板的连接端子,在插入过程中,如果位置没有对正,必须先使电源模块适配器后退,然后重新插入。
(3)安装电源模块前,请确保待安装电源模块的开关处于关闭状态。
(4)不同型号的电源模块不能混插在同一台设备上。
(5)请确保待安装电源模块的供电功率能满足交换机的实际需求。
(6)搬运电源模块时,请用手托住模块的底部,切勿提着模块拉手进行搬运,否则可能会损坏电源模块。
- 板卡故障
1.故障描述:
主控板或业务板卡故障,主控板一般位于1-2或5-6槽位
2.故障判断:
(1)指示灯异常
(2)登录设备通过命令display device 在对应板卡处出现fault
3.解决办法:
(1)更换板卡
(2)为了避免静电对电子器件造成损坏,在安装各类可插拔模块的过程中,请佩戴放静电腕带。
(3)用螺丝刀拧松固定单板的螺丝。(需将螺丝拧下来,才可以取出单板)
(4)将单板上两个扳手向外翻。
(5)一只手托住单板底部(注意不要碰到电路板上的元器件)、另一只手握住单板前面板,沿着插槽导轨平稳拔出。
(6)将新单板上两个扳手向外翻。
(7)一只手托住单板底部(注意不要碰到电路板上的元器件)、另一只手握住单板前面板,沿着插槽导轨平稳插入
(8)将扳手向内合拢,使单板与背板紧密接触。
(9)用螺丝刀拧紧单板上的松不脱螺钉。
(10)查看单板运行状态。
(11)将更换下来的坏件放入坏件库。
(12)单板更换示意图:
4.注意事项:
(1)确认新主控板的版本是否更故障主控板一致,不一致则升级到相同的版本,然后再导入备份的交换机配置。
(2)可以通过交换机主控板上的单板状态指示灯(SLOT)查看单板运行状态,如果指示灯(RUN)闪烁,表示对应该槽位的单板正常工作。
(3)插槽由于不是一个,一般从0开始编号,称槽位。
(4)若设备为双主控板、具有主备倒换功能,可以使用命令display switchover state 查看指定主控板的备份状态,如需更换主控板,需将业务手动切换到备板,,更换完毕后再将业务切换回来。
手动进行主用主控板和备用主控板的主备倒换。
[Sysname] slave switchover
Caution!!! Confirm to switch slave to master?[Y/N] y
slave switchover disable命令用来禁止进行手工主备倒换。
slave switchover enable命令用来使能手工主备倒换功能。
缺省情况下,手动主备倒换功能处于使能状态。
当设备运行在IRF模式时,不支持该命令。可使用chassis convert mode irf 命令完成设备独立运行模式和IRF模式的切换。
- 风扇故障
1.故障描述:
风扇在不同的设备上是不同的,分为非集成(可插拔)与集成(不可插拔)两种,如遇不可插拔,请整机更换
2.故障判断:
(1)指示灯异常
(2)登录设备通过命令display fan/display environment fan 出现:
Fan 1 State: Normal
Normal 说明正常,fault说明故障。
建议:直接更换风扇,或更换整机
1:如果存在fault、absent状态的风扇,表明该风扇状态异常或是不在位,无法提供抽风功能,请拔插风扇框,确定能否恢复正常。
2:如果步骤1不正常,请更换风扇,确定更换风扇框后状态是否正常
3.解决办法:
(1)佩戴放静电腕带
(2)用十字螺丝刀松开风扇框上的松不脱螺钉。
(3)沿着插槽导轨平稳拔出风扇框,将拆卸下来的风扇框放到防静电袋或者初始包装盒中。
(4)将待安装的风扇框沿着导轨插入风扇框槽位,向内推入风扇框,直至风扇框后端和机箱背板紧密接触。
(5)手动将风扇框两侧的松不脱螺钉导正后拧入,再用螺丝刀拧紧螺钉,固定风扇框。
(6)更换下来的坏件放入坏件库。
4.注意事项:
(1)插入过程中,必须借助轻微的惯性将风扇插入机箱。
(2)在插入过程中,如果位置没有对正,必须先使风扇后退,然后重新插入。
(3)不同型号的风扇不能混插在同一台设备上。
- 链路端口故障
1.故障描述:
链路丢包,端口错包,网路卡顿
2.故障判断:
(1)使用主机ping其网关查看是否有丢包
(2)登录接入设备通过命令display interface查询端口的入、出方向流量统计信息,发现错包统计计数是否为0,是否有增加。
Input (total): 693897 packets, 72834962 bytes
22196 unicasts, 584504 broadcasts, 87197 multicasts, - pauses
Input (normal): 693897 packets, 72834962 bytes
22196 unicasts, 584504 broadcasts, 87197 multicasts, 152536 pauses
Input: 0 input errors, 0 runts, 0 giants, 0 throttles
0 CRC, 0 frame, 0 overruns, - aborts
- ignored, - parity errors
Output (total): 7515164 packets, 14001669469 bytes
20811 unicasts, 6228300 broadcasts, 1266053 multicasts, - pauses
Output (normal): 7515164 packets, 14001669469 bytes
20811 unicasts, 6228300 broadcasts, 1266053 multicasts, 0 pauses
Output: 0 output errors, - underruns, - buffer failures
0 aborts, 0 deferred, 0 collisions, 0 late collisions - lost carrier, - no carrier
(3)使用相同命令查看接入与汇聚相连设备是够有错包
3.解决办法:
-
端口入方向出现CRC、frame、throttles错包且计数持续增加
(1) 使用仪器测试链路,链路质量差或者线路光信号衰减过大会导致报文在传输过程中出错。如链路故障请更换网线或光纤。
(2) 如端口使用光模块,参照5.5 光模块故障确认是否光模块故障导致。
(3) 与别的正常的端口更换网线或光纤光模块,如端口更换后错包消失,端口更换回来错包又再次出现端口相关,应为单板端口故障,请更换端口并将故障信息发送技术支持人员分析;如更换到其他正常端口仍会出现错包,则对端设备、中间传输链路故障的可能性较大,请排查。
(4) 排查对端设备或者中间的传输设备。
(5) 如故障无法确认,请将故障信息发送技术支持人员分析。 -
端口入方向出现Overrun错包且计数持续增加
Overrun 计数是由于端口输入速率超出本端口处理能力,导致丢包。
(1) 如果只有某一个端口收发包异常,或者某一个端口下挂设备的业务不通,同时这个单板上的
其他端口都是正常的,可以多次查询display interface 命令:
• 如果 input errors 有增加,且overruns 没有增加,请排查光纤/光模块/对端设备;
• 如果 input errors 有增加,且等于overruns 的增加,那么可以怀疑是单板内部拥塞或堵死,请
将故障信息发送技术支持人员分析。
(2) 如果仍然无法确认,请将故障信息发送技术支持人员分析。 -
端口入方向出现giants错包且计数持续增加
(1) 检查两端的 jumbo 配置是否一致,如jumbo 是否使能,端口默认的最大报文长度是否一致,
允许最大报文长度是否一致。
(2) 如果仍然无法确认,请将故障信息发送技术支持人员分析。 -
端口出方向出现错包且计数持续增加
(1) 检查端口是否配置为半双工模式,如为半双工,请更改为全双工模式。
(2) 如果仍然无法确认,请将故障信息发送技术支持人员分析。
4.注意事项:
(1)端口入方向报文计数错误字段解释
• input errors:端口接收的错误报文的统计值。
• runts:表示接收到的超小帧个数。超小帧即接收到的报文小于64 字节,且包括有效的CRC
字段,报文格式正确。
• giants:接收到的超大帧的数量。超大帧即超过端口设置的最大报文长度的帧。
• CRC:表示接收到的CRC 校验错误报文个数。
• frame:端口接收时出错的报文。
• throttles:接收到的不是整数字节(多1~7bit、不是8 的整数倍)的报文。
(2)端口出方向报文计数错误字段解释
• output errors:各种输出错误的报文总数。
• aborts:表示发送失败的报文总数。
• deferred:表示延迟报文的总数。报文延迟是指因延迟过长的周期而导致发送失败的报文,而
这些报文由于发送媒质繁忙而等待了超过2 倍的最大报文发送时间。
• collisions:表示冲突帧总数,即在发送过程中检测到冲突而停止发送的报文。
• late collisions:表示延迟冲突帧,即发送过程中发生延迟冲突超过512bit 时间的帧。
- OSPF故障
1.故障描述:
邻居状态不正常
(1)卡在down状态
(2)卡在init状态
(3)卡在two way状态
(4)卡在exstart状态
(5)卡在exchange状态
(6)卡在loading状态
2.故障判断:
(1)卡在down状态:ospf没有运行,互不发包
(2)卡在init状态:一方收不到另一方的hello包,如卡在认证
(3)卡在two way状态:没有做出选举
(4)卡在exstart状态:mtu不匹配,exstart中的dbd携带mtu
(5)卡在exchange状态:包的交互有问题
(6)卡在loading状态:lsa加载不完全会卡在loading
3.解决办法:
引发邻居建立不成功问题:
(1)相同route-id
(2)认证问题
(3)区域ID不同
(4)特殊区域标示不一致
(5)优先级都为0,无法选举
(6)MTU不匹配卡住
(7)包的交互不完整,网络中丢包等
(8)hello时间不一致
(9)mask网络掩码不一致(不在一个子网)
- DLDP故障
1.故障描述
网管平台:
XXX-X-XXX-XX-XXX-X DLDP/3/UnidirectionalAuto: DLDP detects a unidirectional link on port GigabitEthernet2/1/16.The shutdown mode is AUTO. DLDP shuts down the port.
登陆设备:暂无
物理现象:端口指示灯熄灭
2.故障判断
接口发生单通,设备配置了DLDP协议,且DLDP模式配置为检测到单通现象自动关闭端口;或本身两端端口DLDP协议出现问题。
3.解决办法
可先在DLDP DOWN的接口执行命令dldp reset,排除是否是协议自身问题导致的DLDP DOWN,若发现重启DLDP后仍旧有问题,建议测试光纤链路。
注意:双方的链路一定要配置强制的双工模式和速率。
链路单通:是指本端设备可以通过链路层收到对端设备发送的报文,但对端设备不能收到本端设备发送的报文。单向链路会引起一系列问题,比如生成树拓扑环路等链路单通分两种情况,一种是单向连接,另一种是交叉连接。
DLDP作用:dldp是一种双向链路检测协议,工作在链路层,主要用来检测链路单通。
dldp正常的端口状态为advertisement
dldp正常的邻居状态为two way