首页 > 编程语言 >【IT老齐057】Raft选举算法

【IT老齐057】Raft选举算法

时间:2024-03-26 15:58:11浏览次数:28  
标签:超时 选举 领导者 任期 老齐 投票 Raft 057 节点

【IT老齐057】Raft选举算法

用途

Raft 算法是分布式系统开发首选的共识算法
主要在分布式集群架构下进行领导者 (主节点)的确认。
比如现在流行的组件 Etcd、Consul、Nacos、RocketMQ、Redis Sentinel 底层都是采用Raft算法来确认集群中的主节点,再通过主节点向其他节点下发指令

1710936412453

如果掌握了这个算法,就可以较容易地处理绝大部分场景的容错和一致性需求。比如分布式配置系统、分布式 NOSQL 存储等等,轻松突破系统的单机限制。
Raft 算法是通过一切以领导者为准的方式,实现一系列值的共识和各节点日志的一致。

角色

  • 跟随者 (Follower) : 普通群众,默默接收和来自领导者的消息,当领导者心跳信息超时的时候,就主动站出来,推荐自己当候选人。
  • 候选人 (Candidate) : 候选人将向其他节点请求投票 RPC 消息,通知其他节点来投票,如果赢得了大多数投票选票,就晋升当领导者。
  • 领导者 (Leader) : 霸道总裁,一切以我为准。处理写请求、管理日志复制和不断地发送心跳信息,通知其他节点“我是领导者,我还活着,你们不要”发起新的选举,不用找新领导来替代我。

选举过程

1710936535669

初始状态

  • 初始状态下,集群中所有节点都是跟随者的状态。如下图所示,有三个节点(Node)a、b、c,任期 (Term) 都为 0。

1710936596996

  • Raft 算法实现了随机超时时间的特性,每个节点等待领导者节点心跳信息的超时时间间隔是随机的。比如A 节点等待超时的时间间隔 150 ms,B 节点 200 ms,C 节点 300 ms。那么 a 先超时,最先因为没有等到领导者的心跳信息,发生超时。如下图所示,三个节点的超时计时器开始运行.

1710936709519

发起投票

  • 当A 节点的超时时间到了后,A 节点成为候选者,并增加自己的任期编号,Term 值从 0 更新为 1。并给自己投了一票。
    • Node A: Term = 1, Vote Count = 1.
    • Node B: Term = 0.
    • Node C: Term = 0.

1710936732306

成为领导

1710936859592

  • 节点 A 成为候选者后,向其他节点发送请求投票 RPC 信息,请它们选举自己为领导者、
  • 节点 B 和 节点C 接收到节点A 发送的请求投票信息后,在编号为 1 的这届任期内,还没有进行过投票,就把选票投给节点 A,并增加自己的任期编号
  • 节点A收到3 次投票,得到了大多数节点 (n/2+1)的投票,从候选者成为本届任期内的新的领导者。
  • 节点A 作为领导者,固定的时间间隔给 节点 B 和节点 C 发送心跳信息,告诉节点 B 和 C,我是领导者,组织其他跟随者发起新的选举
  • 节点 B 和节点 C 发送响应信息给节点 A,告诉节点 A 我是正常的。

任期

1710937025609

  • 自动增加: 跟随者在等待领导者心跳信息超时后,推荐自己为候选人,会增加自己的任号,如上图所示,节点 A 任期为 0,推举自己为候选人时,任期编号增加为 1。

1710937059258

  • 更新为较大值:当节点发现自己的任期编号比其他节点小时,会更新到较大的编号值。比如节点 A 的任期为 1,请求投票,投票消息中包含了节点 A 的任期编号,且编号为 1,节点 B 收到消息后,会将自己的任期编号更新为 1。
  • 恢复为跟随者:如果一个候选人或者领导者,发现自己的任期编号比其他节点小,那么它会立即恢复成跟随者状态。这种场景出现在分区错误恢复后,任期为 3 的领导者受到任期编号为 4的心跳消息,那么前者将立即恢复成跟随者状态。
  • 拒绝消息: 如果一个节点接收到较小的任期编号值的请求,那么它会直接拒绝这个请求,比如任期编号为 6 的节点 A,收到任期编号为 5 的节点 B 的请求投票 RPC 消息,那么节点A 会拒绝这个消息。
  • 一个任期内,领导者一直都会领导者,直到自身出现问题 (如宕机),或者网络问题 (延迟),其他节点发起一轮新的选举。

防止多节点同时发起投票

为了防止多个节点同时发起投票,会给每个节点分配一个随机的选举超时时间。这个时间内,节点不能成为候选者,只能等到超时。比如上述例子,节点A 先超时,先成为了候选者。这种巧妙的设计在大多数情况下只有一个服务器节点先发起选举,而不是同时发起选举,减少了因选票瓜分导致选举失败的情况。

出发新一轮选举

如果领导者节点出现故障,则会触发新的一轮选举。如下图所示,领导者节点 A 发生故障,节点 B和 节点 C 就会重新选举 Leader。

1710937271057


  • 节点A 发生故障,节点 B 和节点 C 没有收到领导者节点 A 的心跳信息,等待超时
  • 节点 C 先发生超时,节点 C 成为候选人。
  • 节点 C 向节点A 和节点 B 发起请求投票信息
  • 节点 C 响应投票,将票投给了 C,而节点A 因为发生故障了,无法响应 C 的投票请求。
  • 节点 C 收到两票 (大多数票数) ,成为领导者。
  • 节点 C 向节点A和 B 发送心跳信息,节点 B 响应心跳信息,节点A 不响应心跳信息
  • 节点 A 恢复后,收到节点 C 的高任期消息,自身将为跟随者,接收节点 C 的消息。

关键机制

保证了一个任期只有一位领导,极大减少了选举失败的情况。

  • 任期机制
  • 领导者心跳信息
  • 随机选举超时时间
  • 先来先服务的投票原则
  • 大多数选票原则

标签:超时,选举,领导者,任期,老齐,投票,Raft,057,节点
From: https://www.cnblogs.com/faetbwac/p/18096859

相关文章

  • 【IT老齐058】Zookeeper解决分布式系统商品库存超卖问题
    【IT老齐058】Zookeeper解决分布式系统商品库存超卖问题场景解决方案传统的synchronized是无效的,它只针对一个JVM进程内多个线程起到同步作用,对跨进程无效。利用数据库select...forupdate语句对库存进行锁定,依赖数据库自身特性,遇到跨库(分库分表)处理起来比较麻烦。利用......
  • 【IT老齐061】BASE最终一致性
    【IT老齐061】BASE最终一致性CAP理论下,常用的AP方案的补全手段BasicallyAvailable(基本可用)Softstate(软状态)Eventuallyconsistent(最终一致性)基本可用就是快速实现用户的基本价值与诉求,“创建订单”后立即返回就是基本可用的体现软状态代表业务操作,没有最终完成前的中......
  • 【IT老齐062】缓存一致性
    【IT老齐062】缓存一致性CacheAsidePattern禁止先删缓存,后更新数据库推荐先更新数据库,在删除缓存极端情况延迟双删......
  • 【IT老齐063】秒杀场景下解决商品库存超卖问题
    【IT老齐063】秒杀场景下解决商品库存超卖问题超卖问题核心问题秒杀商品库存总量固定先到先得,瞬间并发极大,但写库量有限解决方案利用预减库存方式杜绝超卖利用Nginx+Lua在网关层面将无效请求阻挡利用MQ消息队列的限流特性保证MySQL不会被瞬间击垮APP需要额外设计......
  • 【IT老齐053】动静分离架构抗住超高并发访问
    【IT老齐053】动静分离架构抗住超高并发访问架构三大分离设计读写分离动静分离前后台分离概念有效区分页面中的动静数据是优化的关键前提静态数据是无个性化数据静态文件:HTML/CSS/JS/图片低频变动数据:字典数据/地区数据/组织架构历史数据动态数据就是个......
  • 【IT老齐054】MongoDB介绍
    【IT老齐054】MongoDB介绍场景特点多形性:同一个集合中可以包含不同字段(类型)的文档对象动态性:线上修改数据模式,修改是应用与数据库均无须下线数据治理:支持使用JSONSchema来规范数据模式。在保证模式灵活动态的前提下,提供数据治理能力速度优势数据库引擎只需要在......
  • 【IT老齐055】Mysql Ngram全文检索技术
    【IT老齐055】MysqlNgram全文检索技术场景select*fromarticlewheretitlelikeJava%可能用到索引,看索引选择性select*fromarticlewheretitledlike%Java一定不会用到索引select*fromarticlewheretitlelike%Java%一定不会用到索引解决......
  • 【IT老齐056】日千万级订单系统的高可用、高性能架构
    【IT老齐056】日千万级订单系统的高可用、高性能架构原始场景避免丢单关键逻辑不要使用读写分离的查询方式,避免从库同步延迟造成订单查询异常关键逻辑也不要使用缓存来进行订单的查询订单补偿不要粗暴地使用消息队列的方式,避免中间件引发的订单丢失接收消息处理......
  • Windows 10无法登录Xbox及其附属产品(包括但不限于Game Bar,Minecraft Launcher)
     1. 问题描述:打开Xbox(如下图) 或GameBar(如下图)  后,单击登录,会弹出一个窗口,印有自己账户的头像,下方一行小字“欢迎回来,$昵称$”,如下图所示:  单击唯一的绿色按钮“现在就开始吧”,该窗口消失,马上又回到点击登录前的界面。循环尝试结果都不变。2.解决方法第一步......
  • raft算法和etcd代码解析-3.网络分区问题及其它
    网络分区问题网络分区导致选举永远无法达成共识,选举不断超时,任期号将不断增加为避免这个问题,candidate会探测网络环境以免发起无意义的竞选集群变更leader收到配置变更要求,会广播配置变更日志,日志包括新结点和老节点,在收到老节点的多数派认可后,leader后提交该请求在处理配置......