首页 > 其他分享 >kafka的下载和了解

kafka的下载和了解

时间:2023-08-28 22:15:46浏览次数:51  
标签:消费者 队列 kafka topic 处理 了解 消息 下载

可以登录Apache kafka 官方下载

https://kafka.apache.org/downloads.html

下载Scala 2.13  - kafka_2.13-3.3.1.tgz (asc, sha512)

官方推荐下载scala 2.13版本的。

kafka作为一个分布式流平台,有哪些关键的能力?

  • 发布和订阅消息(流),在这方面,它类似于一个消息队列。
  • 以容错(故障转移)的方式存储消息(流)。
  • 记录发送时处理流。

kafka通常应用于两大类应用类型

  • 构建在系统或应用程序之间的可靠获取数据的实时流数据管道;
  • 构建转换或响应数据流的实施流应用程序。

kafka四个核心API

  • 应用程序使用Producer API发布消息到一个或者多个topic(主题)中。
  • 应用程序使用Consumer API来订阅一个或者多个topic,并处理产生的消息。
  • 应用程序使用Streams API充当一个流处理器,从一个或者多个topic消费输入流,并产生一个输出流到一个或者多个输出topic,有效的将输入流转换到输出流。
  • Connector API可构建或者运行可重用的生产者或消费者,将topic连接到现有的应用程序或数据系统。例如,连接到关系数据库的连接器可以捕获表的每个变更。

kafka的特点

  1. kafka作为一个集群运行在一个或者多个服务器上。
  2. kafka集群存储的消息是以topic为类别记录的。
  3. 每个消息(也叫记录record)是由一个key,一个value和时间戳构成。

我们为什么需要消息队列(kafka存在的意义)

  1. 解耦:允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。
  2. 冗余:消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险。许多消息队列所采用的”插入-获取-删除”范式中,在把一个消息从队列中删除之前,需要你的处理系统明确的指出该消息已经被处理完毕,从而确保你的数据被安全的保存直到你使用完毕。
  3. 扩展性:因为消息队列解耦了你的处理过程,所以增大消息入队和处理的频率是很容易的,只要另外增加处理过程即可。
  4. 灵活性 & 峰值处理能力:在访问量剧增的情况下,应用仍然需要继续发挥作用,但是这样的突发流量并不常见。如果为以能处理这类峰值访问为标准来投入资源随时待命无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。
  5. 可恢复性:系统的一部分组件失效时,不会影响到整个系统。消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。
  6. 顺序保证:在大多使用场景下,数据处理的顺序都很重要。大部分消息队列本来就是排序的,并且能保证数据会按照特定的顺序来处理。(Kafka 保证一个 Partition 内的消息的有序性)
  7. 缓冲:有助于控制和优化数据流经过系统的速度,解决生产消息和消费消息的处理速度不一致的情况。
  8. 异步通信:很多时候,用户不想也不需要立即处理消息。消息队列提供了异步处理机制,允许用户把一个消息放入队列,但并不立即处理它。想向队列中放入多少消息就放多少,然后在需要的时候再去处理它们。

kafka的术语

  • Topic

  Kafka将消息分门别类,每一类的消息称之为一个主题(Topic)。

  • Producer

  发布消息的对象称之为主题生产者(Kafka topic producer)

  • Consumer

  订阅消息并处理发布的消息的对象称之为主题消费者(consumers)

  • Broker

  已发布的消息保存在一组服务器中,称之为Kafka集群。集群中的每一个服务器都是一个代理(Broker)。 消费者可以订阅一个或多个主题(topic),并从Broker拉数据,从而消费这些已发布的消息。

kafkad流vs传统企业消息系统

  传统的消息有两种模式:队列和发布订阅。

   在队列模式中,消费者池从服务器读取消息(每个消息只被其中一个读取); 发布订阅模式:消息广播给所有的消费者。这两种模式都有优缺点,队列的优点是允许多个消费者瓜分处理数据,这样可以扩展处理。但是,队列不像多个订阅者,一旦消息者进程读取后故障了,那么消息就丢了。而发布和订阅允许你广播数据到多个消费者,由于每个订阅者都订阅了消息,所以没办法缩放处理。

  kafka中消费者组有两个概念:队列:消费者组(consumer group)允许同名的消费者组成员瓜分处理。发布订阅:允许你广播消息给多个消费者组(不同名)。

  kafka的每个topic都具有这两种模式。 

 kafka有比传统的消息系统更强的顺序保证。

  传统的消息系统按顺序保存数据,如果多个消费者从队列消费,则服务器按存储的顺序发送消息,但是,尽管服务器按顺序发送,消息异步传递到消费者,因此消息可能乱序到达消费者。这意味着消息存在并行消费的情况,顺序就无法保证。消息系统常常通过仅设1个消费者来解决这个问题,但是这意味着没用到并行处理。

  kafka做的更好。通过并行topic的partition —— kafka提供了顺序保证和负载均衡。每个partition仅由同一个消费者组中的一个消费者消费到。并确保消费者是该partition的唯一消费者,并按顺序消费数据。每个topic有多个分区,则需要对多个消费者做负载均衡,但请注意,相同的消费者组中不能有比分区更多的消费者,否则多出的消费者一直处于空等待,不会收到消息。

标签:消费者,队列,kafka,topic,处理,了解,消息,下载
From: https://www.cnblogs.com/zyy-lzw/p/17663029.html

相关文章

  • DNGuard 4.11 4.12 4.20等企业旗舰版 安装包下载
    dnguard4.504.404.304.204.124.11企业旗舰版安装包dng加密.net代码混淆代码保护软件加壳企业版很强大,推荐官网购买 DNGuardHVM-.Netobfuscatorandcodeprotectiontool服务过期,忘记版本更新的可以下载,另外也可以尝试使用demo版本加密体验一下dng,dng从4.X版......
  • 解决VSCode下载速度慢
    1.打开vscode官网浏览器搜索:vscodedownload或打开该网站https://code.visualstudio.com/Download/2.选中系统对应的版本 3.复制下载链接地址 4.修改链接地址将复制后的链接地址的域名(上图https后面框起来的那块)修改为 vscode.cdn.azure.cn最后变成类似:https......
  • VSCode下载慢问题解决
    1.打开vscode官网浏览器搜索:vscodedownload或打开该网站https://code.visualstudio.com/Download/2.选中系统对应的版本 3.复制下载链接地址 4.修改链接地址将复制后的链接地址的域名(上图https后面框起来的那块)修改为 vscode.cdn.azure.cn最后变成类似:https......
  • 04 网图下载
    packageTreadDemo;importorg.apache.commons.io.FileUtils;//commons.io是一个别人写好的包(自己网上下载后导入的),FileUtils是其中的一个类importjava.io.File;importjava.io.IOException;importjava.net.MalformedURLException;importjava.net.URL;//实现多线......
  • 一段时期内的所有哨兵精密轨道数据快捷下载方法
    数据网址https://s1qc.asf.alaska.edu/aux_poeorb/查看页面源代码,源代码直接显示的只有完整文件名,将文件名复制出来在notepad++里面使用列块模式删除多余字符,在前面加上网址前缀拼接成完整的下载链接。1、复制所有链接,在idm下载器里面:任务——从剪贴板中添加批量下载,下载的文件......
  • 读kafka生产端源码,窥kafka设计之道(下)
    背景在上一篇文章《读kafka生产端源码,窥kafka设计之道(上)》留下了kafka设计上比较优秀的一个点;内存的循环使用。本篇文章准备盘盘它。好奇为什么kafka减少发送消息时向JVM频繁申请内存,就可以降低JVMGC的执行次数?我们知道网络上传输的都是二进制数据;而在java中想通过socke网络套接......
  • 网页实现大文件上传下载
    ​ 这里只写后端的代码,基本的思想就是,前端将文件分片,然后每次访问上传接口的时候,向后端传入参数:当前为第几块文件,和分片总数下面直接贴代码吧,一些难懂的我大部分都加上注释了:上传文件实体类:看得出来,实体类中已经有很多我们需要的功能了,还有实用的属性。如MD5秒传的信息。pub......
  • SpringBoot整合kafka配置多个kafka配置
     SpringBoot整合kafka的简单应用及配置说明(包含账号密码配置)、Kerberos证书连接方式:https://www.cnblogs.com/pxblog/p/14821853.html 依赖<dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactI......
  • macOS Sonoma 14 beta 6 (23A5328b) ISO、IPSW、PKG 下载
    macOSSonoma14beta6(23A5328b)ISO、IPSW、PKG下载本站下载的macOS软件包,既可以拖拽到Applications(应用程序)下直接安装,也可以制作启动U盘安装,或者在虚拟机中启动安装。另外也支持在Windows和Linux中创建可引导介质。请访问原文链接:https://sysin.org/blog/macOS-......
  • 下载网络文件到本地的方法
    publicstaticvoidmain(String[]args){ BufferedOutputStreambos=null; BufferedInputStreambis=null; try{ URLurl=newURL("http://www.baidu.com/img/baidu_logo.gif"); URLConnectionconn=url.openConnection(); bis=newBufferedI......