MQTT历史
MQTT 协议于 1999 年发明,用于石油和天然气行业。工程师需要一种协议来实现最小带宽和最小电池损耗,以通过卫星监控石油管道。
最初,该协议被称为Message Queuing Telemetry Transport(消息队列遥测传输),得名于首先支持其初始阶段的 IBM 产品 MQ 系列。2010 年,IBM 发布了 MQTT 3.1 作为任何人都可以实施的免费开放协议,然后于 2013 年将其提交给结构化信息标准促进组织 (OASIS) 规范机构进行维护。2019 年,OASIS 发布了升级的 MQTT 版本 5。现在 MQTT 不再是首字母缩写词,而是被认为是协议的正式名称。
MQTT 背后的原理是什么?
MQTT 协议基于发布/订阅模型工作。在传统的网络通信中,客户端直连服务器,相互通信。客户端向服务器请求资源或数据,然后,服务器将处理并发回响应。
但是,MQTT 使用发布/订阅模式将消息发送者(发布者)与消息接收者(订阅者)解耦。相当于做了中间人。即:发送者不再直接发给接受者,而是发给MQTT程序,由MQTT程序发给接受者。称为消息代理的第三个组件将处理发布者和订阅者之间的通信。代理的工作是筛选所有来自发布者的传入消息,并将它们正确地分发给订阅者。代理将发布者和订阅者解耦,如下所示:
空间解耦
发布者和订阅者不知道彼此的网络位置,也不交换 IP 地址或端口号等信息。
时间解耦
发布者和订阅者不会同时运行或具有网络连接。
同步解耦
发布者和订阅者都可以发送或接收消息,而不会互相干扰。例如,订阅者不必等待发布者发送消息。
MQTT和kafka
MQTT 是协议,Kafka是软件。
MQTT 是协议,是一个技术标准,由 OASIS 技术委员会的成员(其成员多数为 IBM 和微软的顶级工程师)制订,IBM在1999年发布。“MQTT”中的“MQ” 是来自于IBM的MQ系列消息队列产品线。
Kafka是一个程序,具体点说是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统。
最早由 LinkedIn 开发,2011年开源后交给 Apache Incubator 孵化后成为了 Apache 软件基金会的顶级项目。
MQTT 是基于发布/订阅范式的消息协议,而 Apache Kafka 的生产、消费的流程也是属于发布/订阅范式的。那么如果我们基于 MQTT 协议去实现一个消息 broker ,是否这个 MQTT broker是否能和 Kafka 作用等价呢?答案当然是否定的!
Kafka 虽然也是基于发布订阅范式的消息系统,但它同时也被称为“分布式提交日志”或者“分布式流平台”,它的最主要的作用还是实现分布式持久化保存数据的目的。Kafka 的数据单元就是消息,可以把它当作数据库里的一行“数据”或者一条“记录”来理解,Kafka 通过主题来进行分类,Kafka 的生产者发布消息到某一特定主题上,由消费者去消费特定主题的消息,其实生产者和消费者就可以理解成发布者和订阅者,主题就好比数据库中的表,每个主题包含多个分区,分区可以分布在不同的服务器上,也就是说通过这种方式来实现分布式数据的存储和读取, Kafka 分布式的架构利于读写系统的扩展和维护(比如说通过备份服务器来实现冗灾备份,通过架构多个服务器节点来实现性能的提升),在很多有大数据分析需求的大型企业,都会用到 Kafka 去做数据流处理的平台。
而MQTT最开始就是为物联网设备的网络接入而设计的,物联网设备大多都是性能低下,功耗较低的计算机设备,而且网络连接的质量也是不可靠的,所以在设计协议的时候最需要考虑的几个重点是:
1.协议要足够轻量,方便嵌入式设备去快速地解析和响应。
2.具备足够的灵活性,使其足以为 IoT 设备和服务的多样化提供支持。
3.应该设计为异步消息协议而非同步协议,这么做是因为大多数IoT设备的网络延迟很可能非常不稳定,若使用同步消息协议,IoT设备需要等待服务器的响应,对于为大量的IoT设备提供服务这一情景,显然是非常不现实的。
4.必须是双向通信,服务器和客户端应该可以互相发送消息。MQTT 协议完美地解决了上述几点要求,并且最新版的 MQTT v5.0 协议做了很多优化,使其协议相比过去的 v3.1.1 版本具备更强大的灵活性以及对带宽的更少占用。
要说基于 MQTT 协议的消息 broker 和 Kafka 的区别的话,EMQ 君认为还是在于它们的侧重点不同,Kafka 的侧重点在于数据的存储和读取,针对实时性比较高的流式数据处理场景;而 MQTT broker 的侧重点在于客户端和服务器的通信。
MQTT broker 与 Kafka 所采用的消息交换范式是如此相近,将其两者结合起来使用显然是一个非常不错的主意,事实上,很多 MQTT broker,诸如 EMQ X 已经实现了 MQTT broker 与 Kafka 的桥接。MQTT broker 用来快速的对大量物联网设备发来的消息做接收处理响应,而 Kafka 对这些大量的数据做采集存储,交给数据分析人员来分析处理消息。
[MQTT] MQTT和Kafka 啥关系?-腾讯云开发者社区-腾讯云
MQTT 如何与 Kafka 一起使用?
MQTT (Message Queuing Telemetry Transport) 是一种轻量级的消息传输协议,专为受限网络环境下的设备通信而设计。Apache Kafka 是一个分布式流处理平台,旨在处理大规模的实时数据流。
Kafka 和 MQTT 是实现物联网数据端到端集成的互补技术。通过结合使用 Kafka 和 MQTT,企业可以构建一个强大的物联网架构,实现设备和物联网平台之间的稳定连接和高效数据传输。同时,它还能支持整个物联网系统高吞吐量数据的实时处理和分析。
MQTT 和 Kafka 的集成可以为许多物联网场景带来重要价值,例如网联汽车和车联网、智能城市基础设施、工业物联网监控、物流管理等。在本文中,我们将介绍如何实现 MQTT 数据与 Kafka 在物联网应用中的无缝集成。
Kafka 和 MQTT 可以解决哪些物联网挑战?
在设计物联网平台架构时,需要解决以下几个挑战:
1.连接性和网络弹性:在某些关键的物联网场景中,如网联汽车,需要通过网络连接将数据发送到平台。架构应该能够应对网络连接不稳定、网络延迟等各种网络状况。
2.扩展性:为了应对不断增长的设备数量,架构应具备良好的可扩展性,能够处理不断增加的物联网设备所产生的大量数据。
3.消息吞吐量:物联网设备实时产生大量的数据,如传感器读数、位置信息等。平台架构必须支持高消息吞吐量,以确保所有数据都能够有效采集、处理和分发给相应的组件。
4.数据存储:物联网设备持续产生数据流,需要高效的数据存储和管理方案。
为什么需要在物联网架构中集成 MQTT 与 Kafka?
Kafka 作为一个可靠的流数据处理平台,能够有效地促进企业系统间的数据共享,但在物联网场景中,它存在一些不足之处:
1.不可靠的连接:Kafka 客户端需要稳定的 IP 连接,这对于在不稳定的移动网络上运行的物联网设备来说是一个挑战。这些网络的连接非常不稳定,会导致 Kafka 所需的持续通信出现中断。
2.客户端的复杂性和资源密集性:Kafka 客户端以其复杂性和资源消耗而著称。这对于资源受限的小型物联网设备来说是个难题,因为在这些设备上运行 Kafka 客户端可能不现实或效率低下。
3.主题的可扩展性:Kafka 在处理大量主题时存在一些限制。对于物联网应用来说,这可能是一个问题,因为它们可能涉及许多不同的主题,而 Kafka 的架构可能无法有效适应这种情况,尤其是在涉及大量设备且每个设备都有多个主题的情况下。
通过 MQTT 和 Kafka 的集成,可以克服 Kafka 在物联网设备连接方面的许多限制:
1.可靠的连接:MQTT 被设计为在不稳定的网络环境中运行,因此成为物联网设备之间可靠的消息传输协议。
2.轻量级客户端:MQTT 客户端被设计为轻量级,非常适合于资源受限的物联网设备使用。
3.海量主题扩展:MQTT 在处理大量业务主题方面表现出色,对具有大量主题的物联网平台来说它是最理想的选择。可以通过 MQTT 将海量主题汇聚后映射到 Kakfa 主题中,实现物联网数据的汇聚处理。
几种可行的 MQTT-Kafka 集成解决方案对比
在物联网平台中集成 MQTT 和 Kafka 有几种可选的方案。每个方案都有自己的优缺点和需要考虑的因素。下面我们来看一些常用的 MQTT+Kafka 集成方案。
EMQX Kafka 数据集成
EMQX 是一款流行的 MQTT Broker,通过其内置的 Kafka 数据集成功能,能够实现与 Kafka 的无缝集成。作为 MQTT 和 Kafka 之间的桥梁,EMQX 实现了这两者之间的流畅通信。
这种集成使得可以以生产者(向 Kafka 发送消息)和消费者(从 Kafka 接收消息)两种角色创建数据桥接。EMQX 允许用户以这两种角色中的任意一种建立数据桥接。EMQX 具有双向数据传输能力,为架构设计提供了很大的灵活性。此外,它还具有低延迟和高吞吐量的特点,保证了数据桥接操作的高效性和可靠性。
Confluent MQTT 代理
Confluent 是 Kafka 的商业运营公司。它提供了一个 MQTT 协议代理模块,用于连接 MQTT 客户端和 Kafka Broker,使客户端能够发布和订阅 Kafka 主题。这个解决方案将与 Kafka Broker 直接通信的复杂性进行了抽象化,简化了集成过程,避免了多余的复制和延迟。
目前,这个解决方案只支持 MQTT 3.1.1 版本,并且 MQTT 客户端的连接性能可能会影响数据吞吐量。
对开源 MQTT Broker 和 Kafka 进行定制开发
用户可以使用开源的 MQTT Broker,自行开发桥接服务,实现 MQTT 和 Kafka 的连接。这个桥接服务通过 MQTT 客户端从 MQTT Broker 订阅数据,并利用 Kafka Producer API 将数据发送到 Kafka。
这个解决方案需要用户自己开发和维护桥接服务,并且要考虑可靠性和扩展性的问题。
使用 EMQX 将 MQTT 数据集成到 Kafka
EMQX 是一款可扩展的 MQTT Broker,可以与 Apache Kafka 实现双向传输。
EMQX 支持海量的设备连接,结合 Kafka 强大的高吞吐量和持久的数据处理能力,为物联网构建了完美的数据基础设施。
EMQX 提供了以下 MQTT 到 Kafka 的功能:
1.双向连接:EMQX 不仅可以将设备的 MQTT 消息批量转发到 Kafka,还可以从后端系统订阅 Kafka 消息并下发到连接的物联网客户端。
2.MQTT 到 Kafka 主题映射:EMQX 支持多种主题映射方式,例如一对一、一对多、多对多等,同时还支持 MQTT 主题过滤器(通配符)。
3.EMQX Kafka 生产者支持同步/异步写入模式,可根据不同场景灵活平衡延迟和吞吐量。
4.实时指标:例如消息总数,成功/失败交付数,消息速率等,可与 SQL 规则结合使用,用于在将消息推送到 Kafka 或设备之前进行数据的提取、过滤、丰富和转换等操作。
应用场景示例:MQTT 和 Kafka 赋能网联汽车和车联网
MQTT + Kafka 的架构适用于不同行业的各种物联网平台,特别是网联汽车和车联网领域。
以下是这种架构的主要应用场景:
1.车载信息系统和车辆数据分析:MQTT + Kafka 架构可以实现对海量实时车辆数据的云端接入、流式处理与分析,例如传感器读数、GPS 位置、油耗和驾驶行为数据等。这些数据可以用于车辆性能监控、预测性维护、车队管理并提高整体运营效率。
2.智能交通管理:通过集成 MQTT 和 Kafka,可以获取和处理来自各种交通源的数据,例如网联汽车、交通传感器和基础设施。这有助于开发智能交通管理系统,实现实时交通监控、拥堵检测、路线优化和智能交通信号控制。
3.远程诊断:MQTT + Kafka 架构支持网联汽车的高吞吐量数据传输。它可以用于远程诊断和故障排除,实现主动维护和快速问题解决。
4.能源效率和环境影响:MQTT + Kafka 架构使得网联汽车可以与智能电网系统和能源管理平台进行双向数据交互。这个应用场景包括实时监测能源消耗,实施需求响应机制,以及优化电动汽车充电策略。
5.预测性维护:MQTT + Kafka 架构使得可以持续跟踪车辆健康和性能数据。这个应用场景涉及高吞吐量实时车载数据收集,异常检测和预测性维护算法。车主可以及时发现潜在问题并安排维护任务。
MQTT + Kafka 架构非常适用于需要实时数据收集、扩展性、可靠性和物联网集成能力的应用场景。它能够实现数据的流畅传输、高效沟通和创新应用,例如网联汽车生态系统中的各种功能和服务。因此,MQTT 和 Kafka 的结合是一种理想的物联网架构解决方案,它能够实现物联网设备和云之间的无缝端到端集成,并确保双向通信的可靠性。
https://www.emqx.com/zh/blog/mqtt-and-kafka
标签:iot,联网,MQTT,消息,kafka,Kafka,数据,客户端 From: https://blog.csdn.net/u011149152/article/details/139292931