首页 > 其他分享 >谈谈 Kafka 的幂等性 Producer

谈谈 Kafka 的幂等性 Producer

时间:2023-08-03 22:33:29浏览次数:52  
标签:Producer SequenceNumber ProducerID 重复 Broker Kafka 谈谈 消息

使用消息队列,我们肯定希望不丢消息,也就是消息队列组件,需要保证消息的可靠交付。消息交付的可靠性保障,有以下三种承诺:

  • 最多一次(at most once):消息可能会丢失,但绝不会被重复发送。
  • 至少一次(at least once):消息不会丢失,但有可能被重复发送。
  • 精确一次(exactly once):消息不会丢失,也不会被重复发送。

默认是一般是 至少一次,也就是 Broker 收到并成功提交消息,并且 Producer 成功应答才会认为消息已经发送。

某些情况下,比如网络波动等,导致应答没有成功送达,会导致 Producer 重试,从而导致消息的重复发送。

这就要提到主角——幂等性 Producer 了。

幂等性,比如数学中的乘法运算,乘以 1 就是一个幂等操作。因为不管执行多少次乘法,结果都是一样的。

幂等性 Producer 就是在向 Broker 发送数据时,可以避免同个分区下的消息重复。

开启方式仅需指定 enable.idempotencetrue

但是!

有个很重要的一点,它针对的是单个分区下的幂等,而且是单个会话内的幂等,也就是说,如果进程重启,就没办法保证幂等性了。

而幂等性的实现原理,就得提到 ProducerIDSequenceNumber 了。

  • ProducerID:Producer 初始化会被分配一个唯一标识,对客户端无感知,重启会发生变化;
  • SequenceNumber:对于每个主题和分区,都对应一个从 0 开始单调递增的 SequenceNumber 值,Broker 也会存储。

判断重复的逻辑,原理就很简单了:

通过 ProducerID 和 SequenceNumber,去 Broker 查询队列 ProducerStateEntry.Queue(默认队列长度为 5)是否存在:

  • 如果 Producer SequenceNumber == Broker SequenceNumber + 1,接收消息;
  • 如果 Producer SequenceNumber == 0 && Broker SequenceNumber == MaxInt,接收消息(刚初始化);
  • 否则,就是重复了,拒绝接收。

由此看出,ProducerID 和 SequenceNumber 可以避免消息的重复发送,也避免消息乱序(因为 SequenceNumber 单调递增)。

做到幂等性,也就意味着可以安全重试任何操作。从而做到了消息的可靠传输。

然而,还有个很重要的一点,就是上面说的,上面讲的都是分区下的幂等,多个分区的幂等性,需要通过 事务 来解决。

限于篇幅,今天先记录到这里,事务的待我好好研究下再写哈哈!最后,祝大家新年快乐!


文章来源于本人博客,发布于 2023-01-01,原文链接:https://imlht.com/archives/414/

标签:Producer,SequenceNumber,ProducerID,重复,Broker,Kafka,谈谈,消息
From: https://www.cnblogs.com/lofanmi/p/17604689.html

相关文章

  • Access 谈谈数据导出语句 DoCmd.OutputTo
    官方文档:DoCmd.OutputTo方法(Access)|MicrosoftLearn看上去挺复杂的,其实主要看第一和第三个参数.不想去研究的朋友,下面这几行代码,应该够用了'将报表导出为PDF代码DoCmd.OutputToacOutputReport,"报表名称",acFormatPDF,,True'将报表导出为Excel代码D......
  • 搭建zk,kafka环境所遇到的问题
    env:jdk1.8centos7.1zookeeper3.4.6选这版体是因为对kafka做了很多优化,修改 Q1:zk启动不了A1: ./zkServer.sh start-foreground   发现少了myid 解决 :在zk数据文件存放目录下(见$ZK/conf/zoo.cfg,dataDir属性),创建myid文件并写入一个数字用来标识本节点(类似这个节点的......
  • Kafka 2.11 安装和测试
    1.简介 kafka(官网地址:http://kafka.apache.org)是一款分布式消息发布和订阅的系统,具有高性能和高吞吐率。  i.消息的发布(publish)称作producer,消息的订阅(subscribe)称作consumer,中间的存储阵列称作broker。 ii.多个broker协同合作,producer、consumer和broker三者之间通过zooke......
  • kafka权威指南(阅读摘录)
    零复制Kafka使用零复制技术向客户端发送消息——也就是说,Kafka直接把消息从文件(或者更确切地说是Linux文件系统缓存)里发送到网络通道,而不需要经过任何中间缓冲区。这是Kafka与其他大部分数据库系统不一样的地方,其他数据库在将数据发送给客户端之前会先把它们保存在本地缓......
  • 谈谈 Vuex 模块化的缺点
    Vue项目经常需要用到Vuex,Vuex利用响应式,在不同的组件之间传递数据已经相当方便了,但是在使用模块化的过程中还是有点复杂,主要集中在两点:访问state,action,mutation,getter时候,必须使用模块名作为前缀基本没有代码提示假设,store的目录结构是这样的:想要dispatch一个action......
  • kratos项目中使用kafka实现延迟队列
    项目地址https://gitee.com/huoyingwhw/kratos_kafkaB站视频地址B站视频地址——kratos项目中使用kafka实现延迟队列......
  • Kafka - Kafka v.s. NATS v.s. RabbitMQ
     Kafkav.s.RabbitMQ 优先选择Kafka的条件·严格的消息顺序·延长消息留存时间,包括过去消息重放的可能·传统解决方案无法满足的高伸缩能力 优先选择RabbitMQ的条件·高级灵活的路由规则·消息时序控制(控制消息过期或消息延迟)·高级的容错处理能力,在消费者更......
  • 谈谈对Object.defineProperty的理解
    在Vue2实现数据和页面的绑定和双向绑定使用的就是Object.defineProperty方法,然后看到Vue-Router源码的时候发现了一个有趣的事情.就是:通过代理B得到了A对象,其实是相当于B和A其实都指向了同一个地址值,我们在使用Vue的时候去改变或者拿取值一直都是通过A去拿的,在Vue里面他代理......
  • 谈谈企业进行税务风险管理的必要性
    税务风险是指企业在税务管理中,由于涉税行为未能正确有效地遵守税法规定,而导致企业出现经济损失以及企业形象受损的可能性。企业税务风险的来源主要有两个方面:1.企业的纳税行为不符合税收法律法规的规定或对相关的税务政策未能全面理解,应纳税而未纳税、少纳税,从而面临补税、罚款、......
  • 粒博讯谈谈如何在网上赚钱,下班兼职赚钱,这或许有适合你的
    网上赚钱,简称“网赚”。“网赚”主要是指利用计算机、服务器等设备,通过互联网上的各种信息差,从互联网上赚钱的一种方式。兼职赚钱,简单点说就是,你有一份自己的工作是正职,除此之外你还可以再找一份别的工作作为副职,就是工作的同时,兼作另一份工作,叫兼职。近年来,随着互联网的飞速发......