首页 > 其他分享 >【博学谷学习记录】超强总结,用心分享 | Zookeeper

【博学谷学习记录】超强总结,用心分享 | Zookeeper

时间:2023-06-01 10:24:05浏览次数:53  
标签:zookeeper zk 博学 Zookeeper leader 超强 服务器 节点 客户端

【博学谷IT技术支持】

一、Zookeeper 基础知识

Zookeeper地址:https://zookeeper.apache.org/

介绍

Zookeeper是一个开源的分布式协调服务,用来给分布式应用提供一致性服务。Zookeeper本质是一个分布式的小文件存储系统。是Chubby一个开源的实现,是Hadoop和Hbase的重要组件。

特性

  • 一致性: 集群中每台服务都一份相同的副本,客户端访问任何一台数据都是一致的。
  • 可靠性: 如果消息被任意一台服务器接受,那么所有的服务器都会接受。
  • 顺序行: 全局有序和偏序两种,全局有序只是如果一台服务器消息a在消息b前发送,那么所有服务器上都是消息a在消息b前被发送;偏序是指如果消息b在消息a后被同一个发送者发送,消息a必然排在消息b前面。
  • 数据更新原子性: 一次数据更新要么成功,要么失败(半数以上节点成功就算成功)
  • 实时性:在一个时间范围内,Zookeeper会让客户端得到服务器更新消息信息或者服务器失效信息。

角色

Zookeeper有三种角色:分别是领导者(leader)、追随者(follower)、观察者(observer)
请添加图片描述

  • Leader: 领导者对客户端提供读写服务。也是事务请求的唯一调度者和处理者,保证集群事务处理的顺序性。对于create/setData/delete等有些操作的请求,统一有leader处理,leader需要决定编号和执行操作,这个过程称为一个事务。
  • llower: 为客户端提非事务(读操作)请求,转发事务请求给leader,参与leader的选举投票。
  • observer:为客户提供读服务,不参与leader选举机制,转发事务请求给leader。通常用于在不影响集群事务处理能力的前提下提升集群的非事务处理能力。

二、 Zookeeper搭建

Zookeeper一般由2n+1台服务组成,主要原因是为了保证leader的选举能得到多数的支持。

配置环境变量

下载安装包http://archive.apache.org/dist/zookeeper/, 将安装包上传到linux服务器上。最新的是3.8.0 2022年6月17号发布的,一般会用稍微老点的版本

  • 解压安装包
tar -zxvf zookeeper-3.6.0.tar.gz -C '指定好的目录
  • 配置环境变量

修改/etc/profile,添加环境变量

export ZOOKEEPER_HOME=zookeeper文件路径
export PATH=ZOOKEEPER_HOME/bin:$PATH

// 刷新配置文件
source /etc/profile
  • 配置zoo.cfg文件
// 创建数据存放目录
mkdir -p /zookeeper-3.6.0/zkdatas
- 配置zk下的配置文件

cd /zookeeper-3.6.0/conf/
// zoo_sample.cfg是模板文件,需要在拷贝一份
cp zoo_sample.cfg zoo.cfg

vim zoo.cfg
// zoo.cfg
dataDir=/zookeeper-3.6.0/zkdatas

// 文件目录添加集群的主节点和所有从节点
server.1=zk1:2888:3888
server.2=zk2:2888:3888
server.3=zk3:2888:3888
server.4=zk4:2888:3888
server.5=zk5:2888:3888
server.6=zk6:2888:3888
  • 配置myid

回到刚才的数据存放目录,在该目录下创建myid文件,myid的大小关乎该服务是否是Leader,

echo 1 > myid
  • 分发配置

当这台服务的配置好了之后,将安装包分发给其他所有机器

scp -r /zookeeper-3.6.0/ zk1:$PWD
scp -r /zookeeper-3.6.0/ zk2:$PWD
scp -r /zookeeper-3.6.0/ zk3:$PWD
scp -r /zookeeper-3.6.0/ zk4:$PWD
scp -r /zookeeper-3.6.0/ zk5:$PWD
scp -r /zookeeper-3.6.0/ zk6:$PWD

这时还要在每台机器上重新修改下myid,做到各不相同就好了

  • 启动zk

每台服务器都需要做的操作

zkServer.sh start
// 然后执行
zkCli.sh 

得到如下结果就是配置成功了

请添加图片描述

三、zk的数据

数据模型

zk的数据节点采用树形层次,树中的每个节点称为Znode

具有文件和目录两种特点,可以维护数据、元信息、ACL、时间戳等数据结构,也可以作为路径标识的一部分,也可以有子节点。用户可以增删改查。
原子性:读操作会获取与节点相关的所有数据,写操作会替换掉节点的所有数据。每个节点都有自己的访问控制列表,限定了特定用户对节点的操作。
数据限制:因为它主要是管理调度数据的,因此都是很小的数据,最大超过1M

节点类型

Znode有两种节点类型:分别为永久节点临时节点,节点创建后不可改变。同时节点有序列化特性,可以用来记录创建的先后顺序。

区别: 在与是否依赖于会话,永久节点会话结束依然存在,临时节点则会自动被删除。永久节点只能执行删除操作的时候才会被删除

PERSISTENT  永久节点
EPHEMERAL  临时节点
PERSISTENT_SEQUENTIAL:永久序列化节点
EPHEMERAL_SEQUENTIAL:临时序列化节点

四、 操作

  • 创建节点
// 创建永久节点
create /app1 null
// 序列化节点
create -s /app2 null

// 创建临时节点
create -e /app3 null
// 临时序列化节点
create -s -e /app4 null
  • 修改节点
get /节点名称
  • 删除节点
delete /app1 删除单节点
rmr /app1 递归删除节点

更多操作https://zookeeper.apache.org/doc/r3.8.0/zookeeperStarted.html

五、节点属性

请添加图片描述

属性说明

  • cZxid: 创建时的事务ID
  • ctime: 节点创建时间
  • mZxid: 节点最后一次更新时的事务ID
  • mtime: 节点最后一次更新的时间
  • pZxid: 子节点最后一次被修改是的事务ID
  • cversion: 子节点更新的次数
  • dataVersion: 节点数据的更改次数
  • aclVersion: 节点的控制访问列表的更改次数
  • ephemeralOwner: :如果该节点为临时节点, ephemeralOwner值表示与该节点绑定的session id.
  • SessionID: 如果接地那是永久节点,则该属性为0
  • dataLength: 数据内容的长度
  • numChildren: 数据节点当前节点的子节点数

六、Watcher 监听机制

zk提供了分布式数据发布/订阅功能,能让多个订阅者同时监听到某一个主题对象,当这个对象自己状态变化是,会通知所有订阅者,使他们能做出相应的处理。

watcher实现由三部分组成:k服务端zk客户端zk客户端的ZKManager对象

请添加图片描述

客户端首先将Watcher注册到服务端,同时将watch对象保存到客户端的watch管理器中。当zk服务端监听到数据状态变化时,会主动通知客户端,然后客户端的watcher管理器会触发watcher事件来回调处理相应的逻辑。完成整体数据的订阅/发布流程。

特点

  • 一次性触发: 事件发生触发监听,一个watcher event就会被发送到设置监听的客户端,只会触发一次,再次发生不会触发
  • 事件封装:zk使用watcher Event对象封装服务端事件并传递。watcherEvent包含了每一个事件的三个基本属性:通知状态(keeperState)、事件类型(EventType)、节点路径(path)
  • 异步发送: watcher的通知事件从服务端发送到客户端是异步的
  • 先注册再触发: zk的watcher机制,必须客户端先到服务端注册监听,这样事件发送才会触发。

七、zk的选举机制

zk默认的算法是FastLeaderElection,采用投票大于半数则胜出的逻辑

节点状态

  • leader:领导者,master主节点
  • follower: 跟随者,从节点slave
  • observer: 观察者,不参与主节点选举,只提供读操作
  • looking: 临时状态,在集群选举master的过程中,所有follower都会去竞选master.
  • 服务器id: 编号越大在选择算法中的权重越大
  • 数据id: 服务器中存在最新的version,值越大说明数据越新,在选举算法中越新权重越大
  • 逻辑时钟:也叫投票次数,同一轮的投票过程中,逻辑时钟值是相同的,

三台选举

  • 第一台开始投票,投自己,发现服务器没有过半,则等待looking
  • 第二台开始投票,投自己,发现服务器过半了,开始比较服务器id,第二台编号大,则第二台为leader。
  • 第三台开始投票,投自己,发现老大已经有了,然后就变小弟了。

五台选举

  • 第一台投自己,未过半,等待
  • 第二台投自己,未过半,等待
  • 第三台投自己,过半,比较服务器id,第三台大,第三台leader
  • 第四台投自己,过半,有老大了,当小弟
  • 第五台投自己,过半,有老大了,当小弟

标签:zookeeper,zk,博学,Zookeeper,leader,超强,服务器,节点,客户端
From: https://www.cnblogs.com/neilniu/p/17448187.html

相关文章

  • 博学谷学习记录】超强总结,用心分享 | 发送邮件-yagmail
    【博学谷IT技术支持】一、介绍yagmail是一个GMAIL/SMTP客户端,旨在使发送电子邮件尽可能简单。在项目中或多或少都需要使用的它,比如监控,比如用户提示等。二、项目使用使用流程首先要安装yagmail其次链接邮箱服务器,这里要设置发件人的邮箱,发件人的邮箱授权码,发件服务器等参......
  • 【博学谷学习记录】超强总结,用心分享 | Django简易开发指南
    【博学谷IT技术支持】一、介绍Django是python语言写的开源web开发框架,遵循MVC设计。Django的主要目的是简便、快捷的开发数据库驱动的网站。但是Django有一个专有名词:MVTM:Model,负责数据处理,内嵌了ORM框架V:View,接收HttpRequest,业务处理,返回HttpResponseT:Template,负责......
  • 【博学谷学习记录】超强总结,用心分享 | hive分区与分桶的区别
    【博学谷IT技术支持】公众号:积雷山摩云洞,欢迎关注!!!概念分区表:将数据分散到多个子目录中,在执行查询是,可以根据条件加快查询效率分桶表:是相对分区更细的颗粒度划分,分桶表是将表查分到不同的文件中,根据数据表某列的hash值进行分区,对某列数据分区就是对该列属性值的hash值取模,......
  • 【博学谷学习记录】超强总结,用心分享 | yarn的执行流程
    【博学谷IT技术支持】yarn的组成部分hadoop是由Common、HDFS、YARN、MapReduce等核心模块组成,yarn负责解决资源调度问题,这里介绍下yarn的业务执行流程。yarn是Master/Slave结构,主要包含ResourceManage、NodeManager、ApplicationMaster和Conainer等组件。ResourceManager......
  • 【博学谷学习记录】超强总结,用心分享 | 系统资源监控-psutil
    【博学谷IT技术支持】一、介绍psutil(python系统和进程实用程序)是一个跨平台库,用于在Python中检索有关正在运行的进程和系统利用率(CPU、内存、磁盘、网络、传感器)的信息。它主要用于系统监控、分析、限制进程资源和管理正在运行的进程。二、相关api获取CPU信息cpu_count:......
  • 【博学谷学习记录】超强总结,用心分享 | jupyter常用功能
    jupyter安装文档地址https://jupyter.org/installpipinstallnotebook启动命令jupyternotebookjupyter-themes修改主题安装主题https://github.com/dunovank/jupyter-themesgithub地址pipinstall--upgradejupyterthemes查看所有主题jt-l修改主题jt-tg......
  • 【博学谷学习记录】超强总结,用心分享 | hbase基础操作
    【博学谷IT技术支持】HBase的介绍HBase是一个高可靠性、高性能、面向列、可伸缩的分布式操作系统。它是建立在HDFS之上的数据库系统,HBase是不支持SQL的,没有表关系,也无法join,不支持事务。HBase是基于google发布BigTable这篇论文而产生的,基于HDFS,数据最终存储时是在HDFS上,必......
  • 【博学谷学习记录】超强总结,用心分享 | MapReduec编程
    【博学谷IT技术支持】一、介绍MapReduce是将一个大的计算任务拆分成一个个小任务,让小任务在不同的计算机中进行处理,最后将任务的结果进行汇总的过程。MR的工作流程可以分为三个阶段,分别是map、shuffle、reduce二、编程Mapper阶段自定义一个类来集成Mapper类,重写map方法,将方......
  • 【博学谷学习记录】超强总结,用心分享 | java基础
    【博学谷IT技术支持】前言java是一门非常好的语言,比较有必要学习一下:随着科技发展,只会前端是不行的,学习一门后端序言非常有必要,这里记录下自己学习的过程。一、数据类型java是一种强类型语言,数据必须明确类型。基础数据类型有8种,分别是整数类型:byte,short,int,long,......
  • 博学谷学习记录】超强总结,用心分享 | 常用api
    【博学谷IT技术支持】常用APIMath类的常用方法方法名说明publicstaticintabs(inta)返回参数的绝对值publicstaticdoubleceil(doublea)向上取整publicstaticdoublefloor(doublea)向下取整publicstaticintround(floata)四舍五入publicstaticintmax(......