消息队列中，如何保证消息的顺序性？

时间：2023-09-23 12:55:25浏览次数：329

标签：顺序队列 consumer partition queue 消息 mysql 数据

本文选自：advanced-java

作者：yanglbme

问：如何保证消息的顺序性？

面试官心理分析

其实这个也是用 MQ 的时候必问的话题，第一看看你了不了解顺序这个事儿？第二看看你有没有办法保证消息是有顺序的？这是生产系统中常见的问题。

面试题剖析

我举个例子，我们以前做过一个 mysql binlog 同步的系统，压力还是非常大的，日同步数据要达到上亿，就是说数据从一个 mysql 库原封不动地同步到另一个 mysql 库里面去（mysql -> mysql）。常见的一点在于说比如大数据 team，就需要同步一个 mysql 库过来，对公司的业务系统的数据做各种复杂的操作。

你在 mysql 里增删改一条数据，对应出来了增删改 3 条 binlog 日志，接着这三条 binlog 发送到 MQ 里面，再消费出来依次执行，起码得保证人家是按照顺序来的吧？不然本来是：增加、修改、删除；你楞是换了顺序给执行成删除、修改、增加，不全错了么。

本来这个数据同步过来，应该最后这个数据被删除了；结果你搞错了这个顺序，最后这个数据保留下来了，数据同步就出错了。

先看看顺序会错乱的俩场景：

RabbitMQ：一个 queue，多个 consumer。比如，生产者向 RabbitMQ 里发送了三条数据，顺序依次是 data1/data2/data3，压入的是 RabbitMQ 的一个内存队列。有三个消费者分别从 MQ 中消费这三条数据中的一条，结果消费者2先执行完操作，把 data2 存入数据库，然后是 data1/data3。这不明显乱了。

Kafka：比如说我们建了一个 topic，有三个 partition。生产者在写的时候，其实可以指定一个 key，比如说我们指定了某个订单 id 作为 key，那么这个订单相关的数据，一定会被分发到同一个 partition 中去，而且这个 partition 中的数据一定是有顺序的。

消费者从 partition 中取出来数据的时候，也一定是有顺序的。到这里，顺序还是 ok 的，没有错乱。接着，我们在消费者里可能会搞多个线程来并发处理消息。因为如果消费者是单线程消费处理，而处理比较耗时的话，比如处理一条消息耗时几十 ms，那么 1 秒钟只能处理几十条消息，这吞吐量太低了。而多个线程并发跑的话，顺序可能就乱掉了。

解决方案

RabbitMQ

拆分多个 queue，每个 queue 一个 consumer，就是多一些 queue 而已，确实是麻烦点；或者就一个 queue 但是对应一个 consumer，然后这个 consumer 内部用内存队列做排队，然后分发给底层不同的 worker 来处理。

Kafka

一个 topic，一个 partition，一个 consumer，内部单线程消费，单线程吞吐量太低，一般不会用这个。
写 N 个内存 queue，具有相同 key 的数据都到同一个内存 queue；然后对于 N 个线程，每个线程分别消费一个内存 queue 即可，这样就能保证顺序性。

顶尖架构师栈

关注回复关键字

【C01】超10G后端学习面试资源

【IDEA】最新IDEA激活工具和码及教程

【JetBrains软件名】最新软件激活工具和码及教程

工具&码&教程

转载于：https://mp.weixin.qq.com/s/m37BP850gLqSufWZ2_whdw

标签：顺序,队列,consumer,partition,queue,消息,mysql,数据
From： https://www.cnblogs.com/dc-s/p/17724234.html

Kafka的消息传递保证和一致性
前言通过前面的文章，相信大家对Kafka有了一定的了解了，那接下来问题就来了，Kafka既然作为一个分布式的消息队列系统，那它会不会出现消息丢失或者重复消费的情况呢？今天咱们就来一探。实现机制Kafka采用了一系列机制来实现消息传递的保证和一致性，关键点：至少一次的消息传递（AtLeas......
redis消息队列——发布订阅
一、相关依赖<dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId></dependency><dependency><grou......
【POJ 1521】Entropy 题解（贪心算法+优先队列+哈夫曼树）
熵编码器是一种数据编码方法，通过对删除了“浪费”或“额外”信息的消息进行编码来实现无损数据压缩。换句话说，熵编码去除了最初不需要的信息，以准确编码消息。高度的熵意味着一条消息包含大量浪费的信息；以ASCII编码的英文文本是具有极高熵的消息类型的示例。已经压缩的消息，如JPEG图......
Kafka消息压缩算法性能调优与选择
前言Kafka作为一款高性能的分布式消息队列，其消息压缩算法的选择和调优对于系统性能的提升至关重要。本文将深入探讨Kafka消息压缩算法的性能调优和选择。压缩算法的选择Kafka支持多种压缩算法，包括gzip、snappy和lz4。这些算法各有优缺点，需要根据实际情况进行选择。gzipgzip是......
Kafka消息过期与清理策略深入研究
背景Kafka是一个高性能、高可靠、分布式的消息队列系统，被广泛应用于大数据领域。在Kafka中，消息的过期与清理是一个非常重要的问题，本文将深入探讨Kafka中的消息过期与清理策略。Kafka消息过期在Kafka中，消息的过期是通过消息的时间戳（timestamp）来实现的。Kafka支持两种时间戳：消息创......
Kafka消息消费者位移存储性能测试
背景Kafka是一个高性能、分布式的消息队列，被广泛应用于大数据领域。在Kafka中，消费者位移存储是非常重要的一部分，它记录了消费者消费消息的位置，以便在消费者宕机或者重启后能够继续消费未消费的消息。在实际应用中，消费者位移存储的性能对于Kafka的整体性能有着重要的影响。本文将......
Spring Boot中的消息队列集成
介绍在现代应用程序中，消息队列已经成为了一种非常流行的解决方案，它可以帮助我们实现异步通信、解耦和扩展性。SpringBoot提供了对多种消息队列的集成支持，包括RabbitMQ、Kafka、ActiveMQ等。在本文中，我们将深入探讨SpringBoot中的消息队列集成。RabbitMQ集成RabbitMQ是一个流行......
Windows 消息机制
目录Windows和消息消息和消息队列Windows消息类型Windows系统的整个消息系统分为3个层级Q&AWinForm程序中消息处理的相关方法其他代码片段相关参考Windows和消息消息和消息队列名称说明消息和消息队列本部分介绍消息和消息队列，以及如何在应用程序中使用它们。......
JS实现任务队列
引言假设有这么一个场景：前端订阅后台数据的变化，如果发生变化，则触发订阅回调；回调函数中，会执行一些耗时操作，如：请求接口，发送短信，存历史数据等；要求以上所有的操作都必须按照订阅触发的顺序执行；我们都知道，回调本身就是一种异步操作，我们仅仅依靠订阅回调无法保证回调中任务执行顺......
C语言-数据结构之顺序表
#include<stdio.h>#defineN128typedefintdata_type;typedefstruct{ data_typedata[N]; intlast;}sqlist;sqlist*list_create();intlist_show(sqlist*L);intlist_clear(sqlist*L);intlist_destory(sqlist*L);intlist_empty(sqlist*L......