一、可靠性
平均故障间隔时间MTBF(Mean Time Between Failure)和平均修复时间MTTR(Mean Time to Repair)这两个指标来评价系统的可靠性。
1、平均故障间隔时间MTBF
MTBF是指一个系统无故障运行平均时间,通常以小时为单位。MTBF越大可靠性越高。
2、平均修复时间MTTR
MTTR是指一个系统从故障发生到恢复所需的平均时间。广义的MTTR涉及备件管理、客户服务等,是设备维护的一项重要指标。MTTR的计算公式:MTTR=故障检测时间+硬件更换时间+系统初始化时间链路恢复时间+路由覆盖时间+转发恢复时间。MTTR值越小,可靠性越一高。
二、网络可靠性技术(华为)
1、框内高可靠性。
框内高可靠是指设备内部通过部件备份方式提供可靠性能力,在设备部件故障时,通过主备倒换保证业务连续性。例如,主控板1+1的冗余备份、电源冗余、风扇冗余、通信控制单元冗余等等。
2、链路聚合:
通过将多条以太网物理链路捆绑在一起成为一条逻辑链路,从而实现增加链路带宽的目的。同时,这些捆绑在一起的链路通过相互间的动态备份,可以有效地提高链路的可靠性。三个作用:增加带宽、提高可靠性、负载分担。
3、堆叠:
是指将多台支持堆叠特性的交换机设备组合在一起,从逻辑上组合成一台交换设备。通过堆叠线缆连接后组成堆叠iStack,对于上游和下游设备来说,它们就相当于一台交换机Switch。三个优点:高可靠性、强大的网络扩展能力、简化配置和管理;缺点:兼容性差。
4、跨设备链路聚合(M-LAG):
一般在堆叠的跨设备上实现。
5、MSTP:
以太网交换网络中为了进行链路备份,提高网络可靠性,通常会使用冗余链路。但是使用冗余链路会在交换网络上产生环路。STP协议解决了环路MSTP多生成树协议形成多棵无环路的树,解决广播风暴并实现冗余备份,多生成树在VLAN间实现负载均衡,不同VLAN的流量按照不同的路径转发。
6、VRRP:
虚拟路由冗余协议VRRP,通过把几台路由设备联合组成一台虚拟的路由设备,将虚拟路由设备的IP地址作为用户的默认网关实现与外部网络通信。当网关设备发生故障时,VRRP机制能够选举新的网关设备承担数据流量,从而保障网络的可靠通信。
7、MSTP+VRRP:
这是一种常用的组网方式,可以与堆叠做比较。都有效提高可靠性,堆叠简化配置和管理,兼容性差;MSTP+VRRP方式兼容性好,但是配置管理复杂。
三、其他网络可靠性技术
下面可靠性技术主要从降低MTTR的角度,为满足第3级别的可靠性需求来提供技术手段。分为了两种:
1、故障检测技术:
侧重于网络的故障检测和诊断。包括BFD、DLDP、Monitor Link、EFM、CFM等。
1、BFD:
BFD提供了一个通用的标准化的介质无关和协议无关的快速故障检测机制,用于快速检测、监控网络中链路或者IP路由的转发连通状况。
2、DLDP:
设备链路检测协议DLDP(Device Link Detection Protocol)用来监控光纤或铜质双绞线(例如超五类双绞线)的链路状态。如果发现单向链路存在,DLDP协议会根据用户配置,自动关闭或通知用户手工关闭相关接口,以防止网络问题的发生。
3、Monitor Link:
是一种接口联动方案,它通过监控设备的上行接口,根据其Up/Down状态的变化来触发下行接口Up/Down状态的变化,从而触发下游设备上的拓扑协议进行链路的切换。
4、EFM:
最后一公里以太网(Ethernetin the First Mile)主要用于接入层和汇聚层之间链路的以太网物理层规范以及以太网管理和维护,是链路级的OAM(Operation Administration and Management)。针对两台直连设备之间的链路提供链路连通性检测功能、链路故障监控功能和远端环回功能。。(以太网层需要提供一个完全不依赖于任何客户层或服务层的OAM机制。因此以太网OAM(Operations Administration and Maintenance)应运而生。即针对以太网的操作管理和维护。)
5、CFM:
CFM定义了基于以太网承载网络的连接检测的操作、管理和维护功能包括连通性检测功能、环回功能和链路跟踪功能,适用于大规模组网的端到端场景,是网络级的OAM。
2、保护倒换技术:
侧重于网络的故障恢复,主要通过对硬件、链路、路由信息和业务信息等进行冗余备份以及故障时的快速切换,从而保证网络业务的连续性。包括接口备份、双机热备份、VRRP、接口监控组、NSR、Smart Link等,
1、接口备份:
接口备份是指同一台设备的指定接口之间形成备份关系,当某个接口出现故障或带宽不足而导致业务传输无法正常进行时,可以将流量快速的切换到备份接口,由备份接口来承担业务传输或分担网络流量。
2、双机热备份:
当两台设备在确定主用(Master)设备和备用(Backup)设备后,由主用设备进行业务的转发,而备用设备处于监控状态,同时主用设备实时向备用设备发送状态信息和需要备份的信息,当主用设备出现故障后,备用设备及时接替主用设备的业务运行。
3、Smart Link:
又叫做备份链路。一个Smart Link由两个接口组成,其中一个接口作为另一个的备份。Smart Link常用于双上行组网,提供可靠高效的备份和快速的切换机制。
标签:可靠性,工程师,备份,网络,接口,故障,链路,设备 From: https://blog.csdn.net/limengshi138392/article/details/139277664