NSR原理描述
介绍NSR的实现原理。
相关概念
- HA(High Availability):高可靠性/高实用性的简称,这里指主备板间的备份通道。
- NSF(Non-Stop Forwarding):不间断转发。
- NSR(Non-Stop Routing):不间断路由,是一种在系统控制平面发生故障且存在备用控制平面的场景下邻居控制平面不感知的技术。
- AMB(Active Main Board)和SMB(Slave Main Board):主用主控板和备用主控板,单板上承载控制平面进程。
- LPU(Line Interface Process Unit):接口板,单板上承载转发控制进程。
设备上NSR功能缺省使能,无需配置。
NSF与NSR区别
NSF与NSR的区别如表1所示。
特性 |
优点 |
缺点 |
---|---|---|
NSF(GR) |
当系统正常运行时,NSF对系统的负荷较小,系统性能较高。 |
NSF的部署需要邻居节点同样支持,且需要部署在整网中。因此,网络中各设备的协作较为复杂。 当多节点的控制平面均故障时,NSF将失效。 当故障恢复时,需要花费较长时间恢复数据,且网络拓扑的恢复也相对缓慢。 网络拓扑的变化也可能导致NSF失效。 |
NSR |
NSR通过自包含技术使邻居节点无需感知路由信息变化,同时也无需邻居节点支持NSR。 当多个节点的控制平面同时故障时,系统运行情况在可控范围内。 当故障恢复时,需要较短时间恢复数据,且在主备主控板的切换过程中,网络拓扑能够相应恢复。 |
当系统正常运行时,NSR对系统的负荷较大,系统性能相对较低。 软件异常时NSR将失效。 |
NSR原理
如图1所示,NSR原理主要包括以下三个过程:- 批量备份:当备用主控板启动后,NSR功能将使能。此时,主用主控板将路由信息和转发信息批量备份到备用主控板上。批量备份过程在实时备份过程之前进行,此时NSR无法实施主备倒换过程。
- 实时备份:当批量备份过程结束后,系统进入实时备份阶段。任何在控制平面和转发平面的改变都将实时从主用主控板备份到备用主控板上。在该阶段,备用主控板能够随时代替主用主控板工作。
- 主备倒换:在已经完成备份的NSR系统主用主控板发生故障时,备用主控板会通过硬件状态感知到主用主控板故障,并成为新的主用主控板。备用主控板升主后,该单板会切换接口板的报文上送通道。由于倒换时间足够短,路由协议在主备切换的过程中不会和邻居节点断连。
NSR倒换详细过程如下所示。
-
NSR批量备份过程
图2 NSR批量备份过程
实现过程:
备用主控板启动后,主用主控板上的业务进程会收到备用主控板上线的消息。业务进程开始进行内部数据的批量备份。
-
批量数据备份完毕后,系统进入冗余保护状态。进入该状态后,如果主控板出现故障,备板升主后就可以利用之前从主板备份过来的数据进行升主,恢复业务。
-
如果业务批量备份尚未结束时,主控板故障,备板升主后可能会因为业务数据不全而导致无法升主,因此这个种状态下无法完成NSR倒换,设备会整机重启,恢复故障前状态。
-
-
NSR实时备份过程
图3 NSR实时备份过程
实现过程:
完成批量备份后,系统进入实时备份阶段,在该阶段当邻居状态或路由信息发生时,主用主控板会实时将变化信息备份到备用主控板。
-
NSR倒换升主过程
图4 NSR倒换升主过程
实现过程:
完成批量备份,进入冗余保护状态的系统,当主用主控板发生软件或硬件故障后,备用主控板会从底层应该感知到主用主控板的故障,并自行升主。升主后业务进程会使用之前从主用主控板备份来的数据进行工作。同时也会向接口板平滑倒换期间变化的信息。实现真正的路由不中断,转发不中断。