首页 > 其他分享 >初探RocketMQ架构

初探RocketMQ架构

时间:2024-11-28 11:55:12浏览次数:7  
标签:消费 架构 队列 重试 消息 初探 Consumer RocketMQ

目录

一、概述

RocketMQ在MQ中的地位毋庸置疑,java开发者的首选、必会中间件。笔者在深度使用后,结合apache官网、github、源码(版本4.8.0),总结出这个系列文章,供大家参考。本节稍显枯燥,但是有必要读。

自学飞机票:

1.rocketMQ官网

2.github RocketMQ 中文文档

3.参数配置文档

二、概览

RocketMQ是按照典型的生产-消费模型设计的。

2.1、部署架构图

官网架构图黑白色太单调,从网上下了张彩图:

如上图,RocketMQ主要由 Producer生产者、Consumer消费者、Broker代理、NameServer名称服务器 四部分组成。

1.生产者(Producer)

负责发布消息,支持集群部署。Producer通过负载均衡选择Broker集群队列进行消息投递。

2.消费者(Consumer)

负责消费消息,支持集群部署。支持以push推,pull拉两种模式对消息进行消费。群组消费支持:集群方式和广播方式(见2.3)。

3.代理服务器(Broker Server)

消息中转角色,负责存储消息、转发消息。主要包含2个功能:

  • 接收从生产者发送来的消息并存储、同时为消费者的拉取请求作准备。
  • 存储消息相关的元数据:消费者组consumer Group、消费进度偏移offset、主题Topic、队列消息Message Queue等。

4.名字服务(Name Server)

Name Server是Topic路由的注册中心,支持Broker的动态注册与发现。生产者或消费者能够通过名字服务查找各主题相应的Broker IP列表。多个Namesrv实例组成集群,无状态(每个实例数据一样)。

2.2 名词解释

1.主题(Topic)

表示一类消息的集合,每个主题包含若干条消息,是RocketMQ进行消息订阅的基本单位。

2.标签(Tag)

为消息设置的标志,用于同一topic下区分不同类型的消息。可以根据topic+Tag实现消息的精细化生产和消费。

3.消息(Message)

消息系统所传输信息的物理载体,生产和消费数据的最小单位,每条消息必须属于一个主题。每个消息拥有唯一的Message ID,且可以携带具有业务标识的Key。系统提供了通过Message ID和Key查询消息的功能。

4.拉取式消费(Pull Consumer)

Consumer消费的一种类型,应用通常主动调用Consumer的拉消息方法从Broker服务器拉消息、主动权由应用控制。一旦获取了批量消息,应用就会启动消费过程。

5.推动式消费(Push Consumer)

Consumer消费的一种类型,该模式下Broker收到数据后会主动推送给消费端,该消费模式一般实时性较高。

6.生产者组(Producer Group)

同一类Producer的集合,这类Producer发送同一类消息且发送逻辑一致。如果发送的是事务消息且原始生产者在发送之后崩溃,则Broker服务器会联系同一生产者组的其他生产者实例以提交或回溯消费。

7.消费者组(Consumer Group)

同一类Consumer的集合,这类Consumer通常消费同一类消息且消费逻辑一致。要注意的是,消费者组的消费者实例必须订阅完全相同的Topic。RocketMQ 支持两种消息模式:集群消费(Clustering)和广播消费(Broadcasting)。

8.集群消费(Clustering)

集群消费模式下,一个消息只能被一个Consumer消费。

9.广播消费(Broadcasting)

广播消费模式下,相同Consumer Group的每个Consumer都接收全量的消息。

10.普通顺序消息(Normal Ordered Message)

普通顺序消费模式下,消费者通过同一个消费队列收到的消息是有顺序的,不同消息队列收到的消息则可能是无顺序的。(message queue见2.4 消息存储模型)

11.严格顺序消息(Strictly Ordered Message)

严格顺序消息模式下,消费者收到的所有消息均是有顺序的。

三、原理

3.1 总技术架构图

3.2 启动流程

四、特性

了了解原理外还必须清晰知道一款软件的的功能特性,以便后期技术选型。

4.1 业务特性

Apache RocketMQ上描述了6个业务特性:

  1. 低延迟
  2. 面向金融(可跟踪)
  3. 行业支撑(万亿级消息验证)
  4. 标准
  5. 大数据友好
  6. 支持大量消息堆积。

4.2 设计特性

Github上描述了12个设计特性。总结的挺好:

1.订阅与发布

消息的发布是指某个生产者向某个topic发送消息;消息的订阅是指某个消费者关注了某个topic中带有某些tag的消息,进而从该topic消费数据。

2.消息顺序

消息有序指的是一类消息消费时,能按照发送的顺序来消费。顺序消息分为全局顺序消息与分区顺序消息,全局顺序是指某个Topic下的所有消息都要保证顺序;部分顺序消息只要保证每一组消息被顺序消费即可。
- 全局顺序
对于指定的一个 Topic,所有消息按照严格的先入先出(FIFO)的顺序进行发布和消费。
适用场景:性能要求不高,所有的消息严格按照 FIFO 原则进行消息发布和消费的场景
- 分区顺序
对于指定的一个 Topic,所有消息根据 sharding key 进行区块分区。 同一个分区内的消息按照严格的 FIFO 顺序进行发布和消费。 Sharding key 是顺序消息中用来区分不同分区的关键字段,和普通消息的 Key 是完全不同的概念。
适用场景:性能要求高,以 sharding key 作为分区字段,在同一个区块中严格的按照 FIFO 原则进行消息发布和消费的场景。

3.消息过滤

RocketMQ的消费者可以根据Tag进行消息过滤,也支持自定义属性过滤。消息过滤目前是在Broker端实现的,优点是减少了对于Consumer无用消息的网络传输,缺点是增加了Broker的负担、而且实现相对复杂。

4.消息可靠性

RocketMQ支持消息的高可靠,影响消息可靠性的几种情况:

  1. Broker非正常关闭
  2. Broker异常Crash
  3. OS Crash
  4. 机器掉电,但是能立即恢复供电情况
  5. 机器无法开机(可能是cpu、主板、内存等关键设备损坏)
  6. 磁盘设备损坏

1)、2)、3)、4) 四种情况都属于硬件资源可立即恢复情况,RocketMQ在这四种情况下能保证消息不丢,或者丢失少量数据(依赖刷盘方式是同步还是异步)。

5)、6)属于单点故障,且无法恢复,一旦发生,在此单点上的消息全部丢失。RocketMQ在这两种情况下,通过异步复制,可保证99%的消息不丢,但是仍然会有极少量的消息可能丢失。通过同步双写技术可以完全避免单点,同步双写势必会影响性能,适合对消息可靠性要求极高的场合,例如与Money相关的应用。注:RocketMQ从3.0版本开始支持同步双写。

5.至少一次

至少一次(At least Once)指每个消息必须投递一次。Consumer先Pull消息到本地,消费完成后,才向服务器返回ack,如果没有消费一定不会ack消息,所以RocketMQ可以很好的支持此特性。

6.回溯消费

回溯消费是指Consumer已经消费成功的消息,由于业务上需求需要重新消费,要支持此功能,Broker在向Consumer投递成功消息后,消息仍然需要保留。并且重新消费一般是按照时间维度,例如由于Consumer系统故障,恢复后需要重新消费1小时前的数据,那么Broker要提供一种机制,可以按照时间维度来回退消费进度。RocketMQ支持按照时间回溯消费,时间维度精确到毫秒。

7.事务消息

RocketMQ事务消息(Transactional Message)是指应用本地事务和发送消息操作可以被定义到全局事务中,要么同时成功,要么同时失败。RocketMQ的事务消息提供类似 X/Open XA 的分布事务功能,通过事务消息能达到分布式事务的最终一致。

8.定时消息

定时消息(延迟队列)是指消息发送到broker后,不会立即被消费,等待特定时间投递给真正的topic。
broker有配置项messageDelayLevel,默认值为“1s 5s 10s 30s 1m 2m 3m 4m 5m 6m 7m 8m 9m 10m 20m 30m 1h 2h”,18个level。可以配置自定义messageDelayLevel。注意,messageDelayLevel是broker的属性,不属于某个topic。发消息时,设置delayLevel等级即可:msg.setDelayLevel(level)。level有以下三种情况:

- level == 0,消息为非延迟消息
- 1<=level<=maxLevel,消息延迟特定时间,例如level1,延迟1s
- level > maxLevel,则level
maxLevel,例如level==20,延迟2h

定时消息会暂存在名为SCHEDULE_TOPIC_XXXX的topic中,并根据delayTimeLevel存入特定的queue,queueId = delayTimeLevel – 1,即一个queue只存相同延迟的消息,保证具有相同发送延迟的消息能够顺序消费。broker会调度地消费SCHEDULE_TOPIC_XXXX,将消息写入真实的topic。

需要注意的是,定时消息会在第一次写入和调度写入真实topic时都会计数,因此发送数量、tps都会变高。

9.消息重试(消费者)

Consumer消费消息失败后,要提供一种重试机制,令消息再消费一次。Consumer消费消息失败通常可以认为有以下几种情况:
- 由于消息本身的原因,例如反序列化失败,消息数据本身无法处理(例如话费充值,当前消息的手机号被注销,无法充值)等。这种错误通常需要跳过这条消息,再消费其它消息,而这条失败的消息即使立刻重试消费,99%也不成功,所以最好提供一种定时重试机制,即过10秒后再重试。
- 由于依赖的下游应用服务不可用,例如db连接不可用,外系统网络不可达等。遇到这种错误,即使跳过当前失败的消息,消费其他消息同样也会报错。这种情况建议应用sleep 30s,再消费下一条消息,这样可以减轻Broker重试消息的压力。

RocketMQ会为每个消费组都设置一个Topic名称为“%RETRY%+consumerGroup”的重试队列(这里需要注意的是,这个Topic的重试队列是针对消费组,而不是针对每个Topic设置的),用于暂时保存因为各种异常而导致Consumer端无法消费的消息。考虑到异常恢复起来需要一些时间,会为重试队列设置多个重试级别,每个重试级别都有与之对应的重新投递延时,重试次数越多投递延时就越大。RocketMQ对于重试消息的处理是先保存至Topic名称为“SCHEDULE_TOPIC_XXXX”的延迟队列中,后台定时任务按照对应的时间进行Delay后重新保存至“%RETRY%+consumerGroup”的重试队列中。

10.消息重投(生产者)

生产者在发送消息时,同步消息失败会重投,异步消息有重试,oneway没有任何保证。消息重投保证消息尽可能发送成功、不丢失,但可能会造成消息重复,消息重复在RocketMQ中是无法避免的问题。消息重复在一般情况下不会发生,当出现消息量大、网络抖动,消息重复就会是大概率事件。另外,生产者主动重发、consumer负载变化也会导致重复消息。如下方法可以设置消息重试策略:

- retryTimesWhenSendFailed:同步发送失败重投次数,默认为2,因此生产者会最多尝试发送retryTimesWhenSendFailed + 1次。不会选择上次失败的broker,尝试向其他broker发送,最大程度保证消息不丢。超过重投次数,抛出异常,由客户端保证消息不丢。当出现RemotingException、MQClientException和部分MQBrokerException时会重投。
- retryTimesWhenSendAsyncFailed:异步发送失败重试次数,异步重试不会选择其他broker,仅在同一个broker上做重试,不保证消息不丢。
- retryAnotherBrokerWhenNotStoreOK:消息刷盘(主或备)超时或slave不可用(返回状态非SEND_OK),是否尝试发送到其他broker,默认false。十分重要消息可以开启

11.流量控制

生产者流控,因为broker处理能力达到瓶颈;消费者流控,因为消费能力达到瓶颈。

生产者流控:
- commitLog文件被锁时间超过osPageCacheBusyTimeOutMills时,参数默认为1000ms,返回流控。
- 如果开启transientStorePoolEnable == true,且broker为异步刷盘的主机,且transientStorePool中资源不足,拒绝当前send请求,返回流控。
- broker每隔10ms检查send请求队列头部请求的等待时间,如果超过waitTimeMillsInSendQueue,默认200ms,拒绝当前send请求,返回流控。
- broker通过拒绝send 请求方式实现流量控制。

注意,生产者流控,不会尝试消息重投

消费者流控:
- 消费者本地缓存消息数超过pullThresholdForQueue时,默认1000。
- 消费者本地缓存消息大小超过pullThresholdSizeForQueue时,默认100MB。
- 消费者本地缓存消息跨度超过consumeConcurrentlyMaxSpan时,默认2000。

消费者流控的结果是降低拉取频率。

12.死信队列

死信队列用于处理无法被正常消费的消息。当一条消息初次消费失败,消息队列会自动进行消息重试;达到最大重试次数后,若消费依然失败,则表明消费者在正常情况下无法正确地消费该消息,此时,消息队列 不会立刻将消息丢弃,而是将其发送到该消费者对应的特殊队列中。

RocketMQ将这种正常情况下无法被消费的消息称为死信消息(Dead-Letter Message),将存储死信消息的特殊队列称为死信队列(Dead-Letter Queue)。在RocketMQ中,可以通过使用console控制台(官方提供的后台管理WEB界面)对死信队列中的消息进行重发来使得消费者实例再次进行消费。

总结:这12个特性中,需要关注的有:

消息顺序、消息过滤、事务消息、消息重试(消费者)、消息重投(生产者)、流量控制、死信队列。

参考:

RocketMQ架构

标签:消费,架构,队列,重试,消息,初探,Consumer,RocketMQ
From: https://www.cnblogs.com/likeguang/p/18574011

相关文章

  • 库存系统:应用层、领域层、对接层的架构设计
    大家好,我是汤师爷~大厂对候选人的要求较高,即使是20k薪资的岗位,也期望应聘者能够独立承担工作职责。对于30-40k薪资的岗位,需要具备独立系统设计和小型架构设计的能力。技术专家和架构师岗位(30-50k以上)要求应聘者具有带领团队、负责大型系统架构的经验,并且在架构设计方面有全面且......
  • 初探RocketMQ消息消费原理(一)
    目录一.消息消费概述二、消费队列负载机制与重平衡1.1消费队列负载机制与重平衡1.2并发消费模型1.3消息消费进度反馈机制一.消息消费概述消息消费以组的模式开展,一个消费组可以包含多个消费者,每个消费组可以订阅多个主题(一般来说不建议),消费组之间有集群模式和广播模式两种......
  • 为什么大模型都是decoder-only架构?
    大家好!今天和大家聊聊,为什么大模型都是decoder-only架构目前主要的架构有3种:Bert为代表的encoder-only架构,ChatGLM为代表的encoder-decoder,以及GPT为代表的decoder-onlyencoder-only采用的是maskedtoken预训练,一般用于nlu任务。decoder-only采用nexttoken预训练,天然适......
  • qiankun+vite+vue3从零搭建一个微前端架构系统
    本文将记录一下从零搭建一个微前端架构系统,技术栈使用qiankun+vite+vue3,后面还会持续分享主应用与微应用通信,组件共享,性能优化等内容。qiankun官网:介绍-qiankun参考网站:MicroFrontends一、微前端架构介绍微前端是一种多个团队通过独立发布功能的方式来共同构建现......
  • 3、Redis主从、哨兵与集群架构
    Redis主从架构主从搭建步骤1、复制一份redis.conf文件2、将相关配置修改为如下值:port6380pidfile/var/run/redis_6380.pid#把pid进程号写入pidfile配置的文件logfile"6380.log"dir/usr/local/redis-5.0.3/data/6380#指定数据存放目录#需要注释掉bind#......
  • 【系统架构设计师】真题论文: 论数据访问层设计技术及其应用(包括解题思路和素材)
    更多内容请见:备考系统架构设计师-专栏介绍和目录文章目录真题题目(2016年试题3)解题思路论文素材参考(1)数据访问层设计JDBC技术(2)ORM框架技术-Hibernate(3)ORM框架技术-MyBatis(4)数据访问层设计模式-DAO模式(5)数据访问层设计模式-Repository模式......
  • 如何保证RocketMQ消息不丢失
    如何保证RocketMQ消息不丢失目录如何保证RocketMQ消息不丢失背景什么情况下RokectMQ消息会丢失解决RocketMQ消息丢失问题消息生产防止消息丢失Broker端消息丢失消费端处理消息总结背景在金融系统中MQ消息的消息丢失是不允许的,消息的丢失会导致支付状态订单状态出现混乱。接下来......
  • MCA架构师学员在北京,秋招收获京东物流offer,26.5k*16薪
    MCA架构师学员在北京,秋招收获京东物流offer,26.5k*16薪!马士兵教育2024最新版MCA互联网高级架构师课程,Java进阶从0到年薪百万机会在等你!_哔哩哔哩_bilibili......
  • Python反爬虫系统架构设计》毕业设计项目
    大家好我是蓝天,混迹在java圈的辛苦码农。今天要和大家聊的是一款《Python反爬虫系统架构设计》毕业设计项目。项目源码以及部署相关请联系蓝天,文末附上联系信息。......
  • 新兴数据仓库设计与实践手册:从分层架构到实际应用(三)
    本手册将分为三部分发布,以帮助读者逐步深入理解数据仓库的设计与实践。第一部分介绍数据仓库的整体架构概述;第二部分深入讨论ETL在数仓中的应用理论,ODS层的具体实现与应用;第三部分将围绕DW数据仓库层、ADS层和数据仓库的整体趋势展开;通过这样的结构,您可以系统地学习每一层次......