首页 > 其他分享 >什么是脑裂?

什么是脑裂?

时间:2023-11-28 15:22:27浏览次数:22  
标签:什么 ZooKeeper 节点 脑裂 集群 磁盘 leader

参考:https://blog.csdn.net/dreamingzihao/article/details/132527347

概述

  1. 脑裂是在分布式系统中经常出现的问题之一,它指的是由于网络或节点故障等原因,导致一个分布式系统被分为多个独立的子系统,每个子系统独立运行,无法相互通信,同时认为自己是整个系统的主节点,这就会导致整个系统失去一致性和可用性。
  2. 脑裂通常会出现在集群环境中,比如ElasticSearch、Zookeeper集群,而这些集群环境有一个统一的特点,就是它们有一个大脑,比如ElasticSearch集群中有Master节点,Zookeeper集群中有Leader节点
  3. 当一个集群的不同部分在同一时间都认为自己是活动的时候,我们就可以将这个现象称为脑裂症状。通俗的说,就是比如当你的 cluster 里面有两个结点,它们都知道在这个 cluster 里需要选举出一个 master。那么当它们两之间的通信完全没有问题的时候,就会达成共识,选出其中一个作为 master。但是如果它们之间的通信出了问题,那么两个结点都会觉得现在没有 master,所以每个都把自己选举成 master。于是 cluster 里面就会有两个 master
  4. 在脑裂发生时,集群中的每个子集可能都会继续工作,执行读取和写入操作。这可能会导致数据冲突和不一致性。例如,如果一个数据库集群发生脑裂,不同的子集可能会同时接收写入请求,导致数据在不同子集中不同步。当脑裂问题解决后,这些不同的数据可能会导致数据合并困难,进而导致数据损坏或数据丢失

脑裂产生的原因

  1. 网络分区: 当集群中的节点之间的网络连接出现问题,导致某些节点无法与其他节点通信。例如高可用服务器各节点之间心跳线链路发生故障,高可用服务器上开启了iptables防火墙阻挡了心跳消息传输等等
  2. 节点故障: 集群中的某些节点可能因为硬件故障、操作系统问题或其他原因而失去响应,导致其他节点认为它们已经不再可用。例如网卡及相关驱动坏了,ip配置及冲突问题(网卡直连)因心跳线间连接的设备故障(网卡及交换机)
  3. 通信问题: 由于通信协议、时钟同步等问题,节点可能无法准确地识别其他节点的状态,从而导致混淆。

如何判断集群是否发生了脑裂

  • 在分布式系统中这些都是有监控者来判断判断一个节点是否down 掉的,但是监控者也很难判定其他的节点的状态,唯一一个可靠的途径就是心跳,Zookeeper也是使用心跳来判断客户端是否仍然活着。
  • 整体运转流程如下
  1. 每个节点都尝试注册一个象征leader的临时节点,其他没有注册成功的则成为follower,并且通过watch机制监控着leader所创建的临时节点
  2. Zookeeper通过内部心跳机制来确定leader的状态,一旦leader出现意外Zookeeper能很快获悉并且通知其他的follower,其他flower在之后作出相关反应,这样就完成了一个切换,这种模式也是比较通用的模式,基本大部分都是这样实现的。
  3. 但是这里面有个很严重的问题,如果注意不到会导致短暂的时间内系统出现脑裂,因为心跳出现超时可能是leader挂了,但是也可能是zookeeper节点之间网络出现了问题,导致leader假死的情况,leader其实并未死掉,但是与ZooKeeper之间的网络出现问题导致Zookeeper认为其挂掉了,然后通知其他节点进行切换。
  4. 这样follower中就有一个成为了leader,但是原本的leader并未死掉,这时候client也获得leader切换的消息,但是仍然会有一些延时,zookeeper需要通讯需要一个一个通知,这时候整个系统就很混乱可能有一部分client已经通知到了连接到新的leader上去了,有的client仍然连接在老的leader上
  5. 如果同时有两个client需要对leader的同一个数据更新,并且刚好这两个client此刻分别连接在新老的leader上,就会出现很严重问题。
  • 这里做下小总结:
  1. 假死:由于心跳超时(网络原因导致的)认为leader死了,但其实leader还存活着。
  2. 脑裂:由于假死会发起新的leader选举,选举出一个新的leader,但旧的leader网络又通了,导致出现了两个leader ,有的客户端连接到老的leader,而有的客户端则连接到新的leader。

如何解决脑裂问题

过半机制

  1. 在领导者选举的过程中,如果某台zkServer获得了超过半数的选票,则此zkServer就可以成为Leader了。举个简单的例子:如果现在集群中有5台zkServer,那么half=5/2=2,那么也就是说,领导者选举的过程中至少要有三台zkServer投了同一个zkServer,才会符合过半机制,才能选出来一个Leader。

  2. 那zookeeper过半机制中为什么是大于,而不是大于等于?
    这是为了减少脑裂的概率,假设现在有一个由6台zkServer所组成的一个集群,部署在了两个机房,每个机房都有3台zkServer,那么如果机房之间的网络断了之后,两个机房内的zkServer还是可以相互通信的,如果不考虑过半机制,那么就会出现每个机房内部都将选出一个Leader。

Quornums机制

  • 即只有集群中超过半数节点投票才能选举出Leader。这样的方式可以确保leader的唯一性,要么选出唯一的一个leader, 要么选举失败。这是zookeeper防止"脑裂"默认采用的方法。
  • 在ZooKeeper中Quorums有2个作用:
  1. 集群中最少的节点数用来选举Leader保证集群可用:通知客户端数据已经安全保存前集群中最少数量的节点数已经保存了该数据。一旦这些节点保存了该数据,客户端将被通知已经安全保存了,可以继续其他任务。而集群中剩余的节点将会最终也保存了该数据。
  2. 假设某个leader假死,其余的followers选举出了一个新的leader。这时,旧的leader复活并且仍然认为自己是leader,这个时候它向其他followers发出写请求也是会被拒绝的。因为每当新leader产生时,会生成一个epoch,这个epoch是递增的,followers如果确认了新的leader存在,知道其epoch,就会拒绝epoch小于现任leader epoch的所有请求。 那有没有follower不知道新的leader存在呢,有可能,但肯定不是大多数,否则新leader无法产生。Zookeeper的写也遵循quorum机制,因此,得不到大多数支持的写是无效的,旧leader即使各种认为自己是leader,依然没有什么作用。
    通过Quorums机制来防止脑裂和假死,当leader挂掉之后,可以重新选举出新的leader节点使整个集群达成一致;当出现假死现象时,通过epoch大小来拒绝旧的leader发起的请求,在前面也已经讲到过,这个时候,重新恢复通信的老的leader节点会进入恢复模式,与新的leader节点做数据同步。不过这个如果旧的leader处理了数据,就会出现数据丢失的情况。

适当的超时设置

ZooKeeper 使用会话(Session)来管理客户端和服务器之间的连接,设置适当的会话超时时间可以减少脑裂的影响。较短的会话超时时间可以更快地检测到节点失效,从而减少不一致性。

采用Redundant communications (冗余通信)方式

集群中采用多种通信方式,防止一种通信方式失效导致集群中的节点无法通信。

网络配置优化

确保集群中的节点之间的网络连接稳定,避免分区和网络延迟。优化网络配置可以减少网络问题引发的脑裂。

启用磁盘锁

在 ZooKeeper 中,磁盘锁(Disk Lock)是一种额外的安全措施,用于防止脑裂问题。磁盘锁可以在主节点选举时帮助确保只有一个节点被选为主节点,从而降低脑裂风险。启用磁盘锁需要进行一些特定的配置和步骤。
以下是启用磁盘锁的一般步骤:

  1. 配置数据目录: 首先,您需要为每个 ZooKeeper 节点配置一个数据目录(dataDir)。数据目录是节点用于存储数据和元数据的位置。确保您的配置文件中已经正确设置了数据目录。
  2. 配置磁盘锁目录: 在 ZooKeeper 配置文件中,设置一个磁盘锁目录(dataLogDir)。这个目录将用于存储磁盘锁的文件。
  3. 启用磁盘锁: 在 ZooKeeper 的配置文件中,设置 syncEnabled 选项为 true。这将启用磁盘锁机制。
  4. 配置自动清理: 您还可以配置自动清理磁盘锁的选项,以便在主节点意外失效时,其他节点能够顺利选出新的主节点。具体配置可能因 ZooKeeper 版本而异,但通常会涉及到设置一些时间间隔。
  5. 重启 ZooKeeper 节点: 在配置文件修改完成后,您需要重启所有的 ZooKeeper 节点,以使配置生效。

磁盘锁的原理是通过将选举过程的相关信息写入磁盘锁文件,其他节点可以检查这些文件以决定是否进行选举。这在一定程度上增加了选举的稳定性,从而降低了脑裂风险。

请注意,虽然启用磁盘锁可以增加系统的稳定性,但它也会引入一些额外的磁盘 I/O 操作,可能会对性能产生一些影响。因此,在启用磁盘锁之前,建议您仔细评估您的系统需求和性能预期。
尽管磁盘锁可以确保选举信息写入磁盘,但如果出现写入延迟或错误,节点之间的信息同步可能会受到影响,可能导致脑裂。

标签:什么,ZooKeeper,节点,脑裂,集群,磁盘,leader
From: https://www.cnblogs.com/hasome/p/17861230.html

相关文章

  • sqlite数据库删除了数据,为什么文件不会变小?
    SQLite数据库文件的大小不会自动缩小,即使删除了其中的数据。这是因为在SQLite中,当数据被删除时,它实际上并没有立即从磁盘上移除,而是被标记为【已删除】,这种处理机制,被删除的数据仍然占用的空间,标记【已删除】的作用是以后可以被新插入的数据重用。如果想减小SQLite数据库文件......
  • 什么是网络拥塞及解决办法简介
    网络拥塞是指在计算机网络中由于网络资源(如带宽、内存等)的有限性,当网络负载超过其容量时,数据包可能会在网络中延迟或丢失,从而导致网络性能下降的现象。网络拥塞通常会导致网络延迟增加、数据包丢失率上升,甚至可能导致网络连接中断。网络拥塞通常发生在网络通信量较大的情况下,例如:1......
  • python中面向对象有什么特点
    一:问题python中面向对象有什么特点? 二:回答python同其他面向对象语言一样,有3个特征:封装、继承、重写 简单理解就是:封装:把一系列属性和操作封装到一个方法里面,这样想要实现某种效果,只需要简单的调个方法名字就行了,不需要在写一遍所有的操作内容继承:简单理解就是拼爹,父辈拥......
  • python中调用函数,只写一个函数名是什么意思?
    一:问题python中调用函数,只写一个函数名是什么意思? 二:回答只写函数名,则调用的是函数的地址写函数名并传参,则调用的是函数返回值举例说明:1test_data=[{"name":"李白","order":1},{"name":"杜甫","order":4},2{"name":"高力士",......
  • 客户端相关知识学习(一)之混合开发,为什么要在App中使用H5页面以及应用场景、注意事项
     混合开发随着移动互联网的高速发展,常规的开发速度已经渐渐不能满足市场需求。原生H5混合开发应运而生,目前,市场上许多主流应用都有用到混合开发,例如支付宝、美团等。下面,结合我本人的开发经验,简单谈一下对混合开发的认识以及实现方式。Hybrid App(混合开发)主要以JS+Native两......
  • 客户端相关知识学习(五)之什么是webView
      webview是什么?作用是什么?和浏览器有什么关系?Android系统中内置了一款高性能webkit内核浏览器,在SDK中封装为一个叫做WebView组件也就是说WebView是一个基于webkit引擎、可以解析DOM元素展现web页面的控件,它和浏览器展示页面的原理是相同的所以可以把它当做浏览器......
  • 面试官:为什么阿里不推荐使用 keySet() 遍历 HashMap?太叼钻了吧。。
    来源:https://juejin.cn/post/7295353579002396726Part1引言HashMap相信所有学Java的都一定不会感到陌生,作为一个非常重用且非常实用的Java提供的容器,它在我们的代码里面随处可见。因此遍历操作也是我们经常会使用到的。HashMap的遍历方式现如今有非常多种:使用迭代器(Iterator)......
  • 什么是kafka中topic、分区、副本、偏移量、消息保留策略
    Kafka是一个开源的分布式流式数据平台,也成为分布式消息队列。用于高吞吐量、低延迟的数据发布和订阅。 1、什么是topic(主题)? 在Kafka中,Topic(主题)是数据发布和订阅的基本单位,它代表了相同类型的消息流。 一个Topic可以看作是一个逻辑上的数据流管道,消息的生产者(Prod......
  • Java集合ArrayList,LinkedList,Vector的相同点与区别是什么?
    ✨前言✨本篇作为,java集合中ArrayList,LinkedList,Vector常用集合的分析概括,已便大家认识这三种集合的区别,和特点......
  • 00-序言01-向量究竟是什么?
    文章作者:里海简介:    此专栏是学习“线性代数”课程做的笔记,教程来自B站。视频作者是GrantSanderson,这套视频里的动画是他通过manim制作的(manim是一个开源的用于制作数学动画引擎,也是这位开发的)。视频采用直观、动态的方式展示数学概念,将复杂的数学理论转化为易于理解的......