• 2024-12-20【杂谈】主备结构与选主方式
    为什么需要主备结构?为了确保服务的高可用性,系统不能因为某一个节点的故障而完全不可用。因此,我们需要通过主备结构来确保在主节点发生故障时,备份节点能够迅速接管,继续提供服务。为什么不直接通过多个节点共同提供服务?因为这种节点提供的是数据维护和存储服务,为了确保数据的连续
  • 2024-03-02zookeeper 选主核心代码
    选主的核心代码是在org.apache.zookeeper.server.quorum.FastLeaderElection#lookForLeader方法下。选主逻辑的核心代码如下:publicVotelookForLeader()throwsInterruptedException{//无关代码部分忽略self.start_fle=Time.currentElapsedTime();
  • 2023-09-16k8s controller选主
    controller选主代码实现controller多实例可能状态1抢锁成功,作为Leader跑业务2抢锁失败等待3释放锁,结束k8s官方例子go.mod和主流程modulecontroller-by-leader-electiongo1.19require( github.com/google/uuidv1.3.0 k8s.io/apimachineryv0.28.2 k8s.io/client-g
  • 2023-08-08ES选主
    我是javapub,一名Markdown程序员从
  • 2023-07-19通过CM集群管理的openGauss数据库选主策略
    通过CM集群管理的openGauss数据库选主策略前提条件:集群内参与选主的备实例数量超过集群实例总数的一半细分策略:(1)cma会尝试拉起数据库集群原始主实例,6s内成功拉起则无需新一轮仲裁(2)local_term最大的(3)local_last_xlog_location最大的(4)静态主local_static_role(5)与
  • 2023-07-18Multi Paxos 、Raft 、ZAB 算法
    参考:凤凰架构:https://icyfenix.cn/distribution/consensus/raft.html 一、将共识问题分解为三个问题1.选主《https://www.cnblogs.com/suBlog/p/17554677.html》BasicPaxos的活锁问题,两个提案节点互不相让地争相提出自己的提案,抢占同一个值的修改权限,导致整个系统在持续
  • 2023-06-09Raft一致性算法
    分布式的高可用方案都会考虑容灾,那么redis高可用是如何做到故障自动切换的?1增加主客观下线判定。对于主客观下线判定,当某个哨兵节点与主节点连接超时,则将其标志位主观下线,然后开始将主节点下线这个信息与其他哨兵节点同步,其他哨兵节点根据自身与主节点的通信情况,做出赞成或者
  • 2023-05-03Etcd选主源码分析
    Etcdv3.4.0Raft角色Raft集群中节点分为3种状态:领导者Leader、追随者Follower、候选者Candidate。正常情况下,集群中的节点只存在Leader与Follower这2种状态。Leader:负责日志的同步管理,处理写请求,与Follower保持心跳。Follower:响应Leader的日志同步请求和Candidate的投票请求,把
  • 2023-04-16聊聊Redis sentinel 机制
    Redis的哨兵机制自动完成了以下三大功能,从而实现了主从库的自动切换,可以降低Redis集群的运维开销:监控主库运行状态,并判断主库是否客观下线;在主库客观下线后,选取新主库;选出新主库后,通知从库和客户端。 一、为什么需要哨兵主从模式下,如果主库发生故障了,那就直接会影响到
  • 2023-04-09FastCFS:再谈 选主 与 过半写:续:2节点+vote节点 群集
    偶数的 2节点+vote节点群集健壮程度如何呢?先说结论:可以保证足够健壮。 虽然vote节点仅参与选主,不参与数据复制过程的过半写,but,对于FastCFS群集来说,先要完成“选主”才能正常进行数据复制层面的”过半写“!如果没有“选主”,根本就不会有后续“过半写”的问题。哈哈。 所
  • 2023-04-09FastCFS:再谈 选主 与 过半写:续:2节点群集 默认配置下,十分不可靠,几乎100%会发生脑裂问题!
     如题:仅能由于测试。千万不要用于生产环境!“选主” 通常能够完成,无法是否有vote参与;问题在于:“过半写”的any或auto模式(即隐含的smart模式)在成功“选主“后,会运行在单节点server的群集模式下,此时,根本就无法且没有完成正常意义上的数据层的主从同步,即必然发生脑裂!数据就不一
  • 2023-04-07FastCFS:再谈 选主 与 过半写
    这二者乍一看好像是一回事:都是要求遵循大多数原则(即过半数原则)。其实,在概念上是不同的! 选主:本质是功能角色的概念。“国不能一日无主、群龙不能无首;否则,则是”一盘散沙、溃不成军“。对于FastCFS组件的群集来说,必须要有master,这个master是在server中自动选出来的,选择mast
  • 2023-04-05ZooKeeper数据和集群特点,ZAB协议和选主过程解析
    前言本文讲述ZooKeeper集群架构特点、数据结构、事务ID、选主和ZAB协议具体执行过程。服务保证ZooKeeper非常快速且非常简单。由于它的目标是构建更复杂的服务(如同步)的基础,因此它提供了一组保证:【顺序一致性】来自客户端的更新将按发送顺序执行,因为只有唯一的主节点负责写
  • 2023-03-10Zookeeper Leader选举
    Leader选举的原理,也就是大名鼎鼎的Zab协议的一部分。Zab只是一个协议,或者说只是一个概念,ZooKeeper是这个协议的具体实现,并不是只有选举用到了Zab协议,而是其他地方
  • 2023-02-18k8s学习-记录一次集群kube-controller,scheduler等多个pod重启的问题解决
    问题一次,集群的kube-controller,scheduler等容器重启,查看日志,发现时间很集中,在秒级范围内多个pod同时重启。查看pod状态kubectlgetpod-nkube-system|grepkube-contro
  • 2023-02-15【RocketMQ】DLedger选主源码分析
    RocketMQ4.5版本之前,可以采用主从架构进行集群部署,但是如果master节点挂掉,不能自动在集群中选举出新的Master节点,需要人工介入,在4.5版本之后提供了DLedger模式,使用Raft算
  • 2023-02-09 ZooKeeper 避坑实践: Zxid溢出导致选主
    作者:子葵​背景线上 flink用户使用ZooKeeper做元数据中心以及集群选主,一些版本的flink在ZooKeeper选主时,会重启Job,导致一些非预期的业务损失。而ZooKeeper在 zx
  • 2022-12-01集群常见的基本形式
    集群的目标高可用:,是当一台服务器停止服务后,对于业务及用户毫无影响。停止服务的原因可能由于网卡、路由器、机房、CPU负载过高、内存溢出、自然灾害等不可预期的原因导致
  • 2022-11-30ZooKeeper 避坑实践:如何调优 jute.maxbuffer
    作者:子葵背景在日常运维ZooKeeper中,经常会遇到长时间无法选主,恢复时进程启动又退出,进而导致内存暴涨,CPU飙升,GC频繁,影响业务可用性,这些问题有可能和jute.maxbuffer的