随着信息技术的快速发展和普及,企业对信息的依赖程度越来越高。网络作为信息传输的载体,企业对其可靠性的要求也越来越高,而建立一个可靠的网络系统是一项复杂且艰巨的工作。网络可靠性设计是网络规划设计的关键一环且非常复杂,SD-WAN解决方案的可靠性设计,其中包括3个部分:网络链路可靠性设计、网络设备可靠性设计和网络核心站点可靠性设计。
1、网络链路可靠性设计
网络链路作为最基本的信息数据载体,是网络的命脉。网络链路的中断意味着信息传递的中断,这对很多领域(如金融、证券、航空、铁路、邮政等)的用户来说是灾难性的。这些领域的网络一旦发生故障,会带来非常巨大的经济损失。
从物理层面看,网络是由多种网络设备和线缆构建的,本身存在发生故障的可能性,如网络传输设备发生故障、物理线缆被暴力施工挖断、网络核心节点因天灾人祸失效等,这些都可能导致网络端到端连接的中断。为了规避这些风险,通常采用主备网络链路的策略,即同时建设一条主链路和一条备链路。这样的设计简单、可靠,美中不足的是备链路通常情况下处于备份的状态,不转发网络流量,这将导致企业客户为了可靠性不得不为之支付额外的专线费用。
SD-WAN解决方案提供的链路主备方式撇弃了以上介绍的这种单纯的主备模式,网络站点的多条上行链路会同时处于活动状态,基于预设的流量调度策略使业务流量在多条链路中进行负载分担。当某条链路发生故障时,可以在极短的时间内检测出链路质量发生劣化,从而及时调整业务的流量策略,将流量从故障链路切换到正常链路上,提升链路的可靠性。如此可充分利用企业的接入专线,提高企业接入带宽,加强企业站点的互联。
- CPE与Underlay网络全互联的场景
企业站点之间可基于多种Underlay网络(如MPLS网络和因特网)互联。站点CPE各有两条链路分别接入MPLS网络和因特网,并各自维护Underlay网络的连接信息,当其中某个Underlay网络发生故障后(如MPLS网络发生故障),站点CPE主动将业务流量切换至另一个Underlay网络的链路,确保分支站点之间能够正常通信。
- CPE分别连接一个Underlay网络的场景
当某个站点采用双CPE作为出口网关,CPE之间通过互联链路连接,同时CPE上行仅连接一个Underlay网络(如MPLS网络或因特网)。各CPE仅负责检测自身上行互联的Underlay网络的状态,并通知另一台CPE监测结果。当某台CPE检测到互联的Underlay网络链路发生故障后,会通知另一台CPE,同时对报文转发策略进行调整,将报文通过互联链路转发到另一台CPE,从而规避上行链路的故障问题。
2、网络设备可靠性设计
除了线路故障外,网络设备故障也是网络可靠性的重灾区,特别是作为站点出口的网关设备,一旦发生故障,将直接影响站点间的互通。出于保障站点可靠性的考虑,站点出口处通常会部署两台CPE。与传统备份方式不同的是,这两台CPE不是工作在主备模式下,而是工作在双活模式下,即两台设备同时工作,当其中一台CPE发生故障后,另一台CPE将承担所有流量的转发。
由于两台设备同时工作,需要同步其业务信息(如业务会话、应用识别的信息)、链路统计信息和报文调度的策略,使两台设备可以像一台设备那样工作。除了各种信息的同步外,两台设备间可通过探测协议识别彼此的状态。一旦发现邻居设备出现故障,当前正常的设备将接管所有站点的业务,保证网络通信的连通性,并实时调整报文调度的机制,使业务体验达到最佳。
站点内设备的备份有以下两种方式。
- LAN侧二层组网:可通过VRRP进行备份。VRRP可以支持多个VRRP实例,通过多个实例实现设备的负载分担。
- LAN侧三层组网:可通过等价路由进行备份。传统路由器从SD-WAN设备中学习到等价路由,在正常情况下通过ECMP(Equal-Cost Multi-Path,等价多路径)进行负载分担,当设备出现故障时,对应的邻居关系被撤除,相应的路由信息被撤销。
3、网络核心站点可靠性设计
自然灾害等不可抗拒的因素(如地震、火灾等)会导致企业核心站点(如Hub站点)出现故障。核心站点失效后,其他站点将处于信息孤岛中,与外界完全失去网络联系,严重影响企业网络的正常运转。因此,核心站点的可靠性显得尤其重要。
- Hub站点冗余设计
采用Hub-spoke组网模式时,所有分支站点的数据都需经过Hub站点,若Hub站点失效,则可能导致整网的瘫痪。因此,不仅Hub站点内的设备需采用可靠性方案,同时站点本身也需要采用冗余方案。SD-WAN解决方案提供了双Hub站点冗余方案,当主Hub站点发生故障后,所有流量将能很快地切换至备份Hub站点,该过程无须人工干预。
- 重定向站点冗余设计
在Full-mesh组网中,站点间是通过建立直连隧道进行通信的;若站点间Underlay网络无法互通,则站点间无法建立直连隧道。为了解决此问题,SD-WAN解决方案引入了重定向站点。为了提升重定向站点的可靠性,需要针对重定向站点进行冗余设计,即当其中一个重定向站点出现故障时,流量能很快地切换至备用重定向站点。因重定向站点需要中转其他站点间的流量,对吞吐量有较高的要求,所以一般选择企业的总部、数据中心或大中型的分支站点来兼任此角色。
标签:WAN,可靠性,网络,CPE,站点,故障,链路,SD From: https://blog.51cto.com/key3feng/6148317