揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！

时间：2023-02-01 22:32:38浏览次数：62

如何设计高可靠的物理架构？以运营商数据中心组网为例

对于云计算这个名词，相信大家都不会陌生，这个词不但讲了很多年，而且我相信，未来几年后一定还会继续讲。

本篇主要总结的是在设计时如何实现物理架构的高可用性，如有不对的地方，请多多指教。

一、服务器高可靠性

在所有的云环境，几乎所有的设备都可以通过热备、对叠等技术保障业务的可持续性，单台设备故障时业务几乎无感知，唯独节点服务器不具备设备级的热冗余，但节点服务器整机故障后，业务总是会被影响，除非具备类似VMware的FT技术。所以节点服务器并不具备设备级别的高可靠性，只具备部件级别的高可靠性。

服务器部件的高可用只要体现在几方面：

1、存储高可靠。主要是通过做RAID实现，一般来说系统盘会使用块物理硬盘组成RAID1实现高可靠；由于是云架构，基本上虚拟机不会使用本地盘，所以计算节点一般不需要数据盘，即每个节点服务器只需要有两块硬盘组RAID1作为系统盘即可。

2、电源高可靠。通常服务器具备双电源甚至更多，机柜至少接入两路市电进行供电，防止单路市电故障导致节点服务器下电。

揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！_插槽

3、连线高可靠。在华为的解决方案中，服务器网络被划分成三个平面，分别是管理平面、存储平面和业务平面，在资源不富裕的场景，通常将管理平面和存储平面进行合并，称为存管平面。管理平面和存储平面使用bond mode 1（主备模式），业务平面因网络带宽要求高，通常使用 bond mode 4（负载分担模式）。无论是哪种模式，都需要两个网口组成，即两个网口上联到接入交换机，如何实现连线高可用？

1）跨网卡

通常来说单个网卡至少具备两个网口，如果单个平面bond的两个网口都属于同一张网卡，当该网卡故障时，该平面网络不可用，导致业务受损，所以在设计时一定要跨网卡。如网卡1的1口和网卡2的1口组成管理bond，2口组成业务bond，这样当网卡1或着网卡2故障时，虽然网络处理能力下降，但不会导致业务完全不可用。

揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！_连线_02

2）跨CPU（跨NUMA）

用于云计算场景的服务器，至少有2颗物理CPU，而不同的插槽属于不同的物理CPU管理，将不同的网卡均衡的分布在不同的CPU上，避免所有网卡都插在同一个CPU所管理的插槽上。这样做的好处有两个，一是提高将网络的处理能力分担到两个CPU上，效率更高，二是单CPU故障时，另一个CPU上的网卡不受影响。

揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！_服务器_03

二、交换机高可靠

所有的设备都具备电源高可靠性，这点就不再赘述了，交换机但前主要使用M-LAG实现设备级的高可靠性，但台故障业务几乎无感知。

揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！_服务器_04

1）连线的冗余比较简单，但是使用哪个端口去就需要看交换机的具体配置了，以华为CE6800系列某款48光口交换机为例，该交换机具有两颗CPU，其中0～23口归属CPU0,24～47口归属CPU1，所以我们对端口的使用应该根据交换机本身的性能配置规划，假设只使用到24个端口，那么将前12个端口使用0～23，另外12个端口使用24～47是比较好的选择，该部署优势可参考上面服务器的说法。

揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！_插槽_05

三、其他设备

其他设备如路由器、防火墙的硬件可靠性基本和交换机一致，只是软件层面的可靠性机制不一样，常见的路由器可靠性协议为VRRP，防火墙则为双机热备。

我是运维少年，喜欢的话可以关注我的同名公众号哦！

END

标签：数据中心,CPU,网卡,交换机,物理层,平面,服务器,揭秘,bond
From： https://blog.51cto.com/xiaowangzai/6031953

我在京东做研发 | 揭秘支撑京东万人规模技术人员协作的行云 DevOps 平台
随着业务变化的速度越来越快各类IT系统的建设也越来越复杂大规模研发团队的管理问题日益突出如何提升研发效能成为时下各类技术团队面临的重要挑战京东云DevOps......
TCP/IP五层体系结构之物理层
作用：确定传输媒体和接口有关的一些特性，例如电气特性、机械特性和电气特性等。物理层的传输媒体：传输媒体也称为传输介质或传输媒介，它就是数据传输系统中在发送器和接收器......
DTSE Tech Talk 第18期丨统计信息大揭秘，数仓SQL执行优化之密钥
摘要：华为云EIDTSE技术布道师王跃，针对统计信息对于查询优化器的重要性，GaussDB(DWS)最新版本的analyze当前能力，与开发者和伙伴朋友们展开交流互动，帮助开发者快速上手使用统计......
DTSE Tech Talk 第18期丨统计信息大揭秘，数仓SQL执行优化之密钥
摘要：华为云EIDTSE技术布道师王跃，针对统计信息对于查询优化器的重要性，GaussDB(DWS)最新版本的analyze当前能力，与开发者和伙伴朋友们展开交流互动，帮助开发者快速上手使用统......
【Dubbo3 终极特性】「云原生三中心架构」带你探索 Dubbo3 体系下的配置中心和元数据
承接上文通过之前的【Dubbo3终极特性】「云原生三中心架构」带你探索Dubbo3体系下的配置中心和元数据中心、注册中心的原理及开发实战（上），让我们对Dubbo3的三中心架构体系......
【Dubbo3 终极特性】「云原生三中心架构」带你探索 Dubbo3 体系下的配置中心和元数据
承接上文通过之前的【Dubbo3终极特性】「云原生三中心架构」带你探索Dubbo3体系下的配置中心和元数据中心、注册中心的原理及开发实战（上），让我们对Dubbo3的三中心架构体系有......
华为运动健康服务Health Kit 6.9.0版本新增功能揭秘！
华为运动健康服务（HUAWEIHealthKit）6.9.0版本新鲜出炉啦！一文了解新增功能，快来一起加入HealthKit生态大家庭！一、更丰富：睡眠呼吸记录健康数据开放呼吸机是用于为患者提供......
华为运动健康服务Health Kit 6.9.0版本新增功能揭秘！
华为运动健康服务（HUAWEIHealthKit）6.9.0版本新鲜出炉啦！一文了解新增功能，快来一起加入HealthKit生态大家庭！一、更丰富：睡眠呼吸记录健康数据开放呼吸机是用于为患者提供......
【Dubbo3终极特性】「云原生三中心架构」带你探索Dubbo3体系下的配置中心和元数据中心
Dubb3的应用级服务发现Dubbo3提供了全新的应用级服务发现模型，该模型在设计与实现上区别于Dubbo2的接口级服务发现模型。概括来说，Dubbo3引入的应用级服务发现主要有以下优......
【Dubbo3终极特性】「云原生三中心架构」带你探索Dubbo3体系下的配置中心和元数据中心
Dubb3的应用级服务发现Dubbo3提供了全新的应用级服务发现模型，该模型在设计与实现上区别于Dubbo2的接口级服务发现模型。概括来说，Dubbo3引入的应用级服务发现主要有......

揭秘运营商数据中心的物理层高可用机制，竟如此简单细节！

如何设计高可靠的物理架构？以运营商数据中心组网为例

一、服务器高可靠性

二、交换机高可靠

三、其他设备

相关文章

赞助商

阅读排行