Apache Kafka

时间：2023-11-14 23:33:09浏览次数：26

标签：一个应用程序 Kafka topic API 流式 Apache

Apache Kafka® 是一个分布式流处理平台. 这到底意味着什么呢?

我们知道流处理平台有以下三种特性:

可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。
可以储存流式的记录，并且有较好的容错性。
可以在流式记录产生时就进行处理。

Kafka适合什么样的场景?

它可以用于两大类别的应用:

构造实时流数据管道，它可以在系统或应用之间可靠地获取数据。 (相当于message queue)
构建实时流式应用程序，对这些流数据进行转换或者影响。 (就是流处理，通过kafka stream topic和topic之间内部进行变化)

为了理解Kafka是如何做到以上所说的功能，从下面开始，我们将深入探索Kafka的特性。.

首先是一些概念:

Kafka作为一个集群，运行在一台或者多台服务器上.
Kafka 通过 topic 对存储的流数据进行分类。
每条记录中包含一个key，一个value和一个timestamp（时间戳）。

Kafka有四个核心的API:

The Producer API 允许一个应用程序发布一串流式的数据到一个或者多个Kafka topic。
The Consumer API 允许一个应用程序订阅一个或多个 topic ，并且对发布给他们的流式数据进行处理。
The Streams API 允许一个应用程序作为一个流处理器，消费一个或者多个topic产生的输入流，然后生产一个输出流到一个或多个topic中去，在输入输出流中进行有效的转换。
The Connector API 允许构建并运行可重用的生产者或者消费者，将Kafka topics连接到已存在的应用程序或者数据系统。比如，连接到一个关系型数据库，捕捉表（table）的所有变更内容。

Apache Kafka_API

在Kafka中，客户端和服务器使用一个简单、高性能、支持多语言的 TCP 协议.此协议版本化并且向下兼容老版本，我们为Kafka提供了Java客户端，也支持许多其他语言的客户端。

标签：一个,应用程序,Kafka,topic,API,流式,Apache
From： https://blog.51cto.com/u_14299064/8380216

kafka第七天学习笔记
在Kafka学习的第七天，你可能会进一步深入了解Kafka的特性和工作机制。以下是一些可能的学习点：Kafka的存储机制：Kafka使用一种称为“日志文件”的存储机制，将消息作为字节流存储在硬盘上。这种存储方式使得Kafka能够高效地处理大量的数据。消息的索引：Kafka为每个分区在硬盘上创建一个索......
Linux安装Kafka
前言本文Kafka演示版本依赖Zookeeper，需要先安装Zookeeper：Linux安装Zookeeper1.解压文件tar-zxvfkafka_2.12-2.7.02.修改配置文件，日志输出地址vimconfig/server.propertieslog.dirs=/opt/kafka_2.12-2.7.0/logs3.启动bin/kafka-server-start.sh-daemonconfig/s......
kafka第六天学习笔记
在Kafka学习的第六天，你可能会遇到一些新的概念和技能，这些可能包括：Kafka的复制因子（ReplicationFactor）：这是一种确保数据安全的方法，通过增加冗余数据来防止数据丢失。复制因子定义了每个主题的分区应在多少个副本中存在。消费者组（ConsumerGroup）：这是一个消费者实例的集合，他们共享一个......
Apache DolphinScheduler实战(07)-缓存机制
1缓存目的由于M/S调度过程中，会产生大量数据库读操作，如tenant，user，processDefinition等：对DB产生很大读压力使整个核心调度流程变慢考虑这部分业务数据读多写少，引入缓存模块：减少DB读压力，加快核心调度流程。2缓存设置spring:cache:#defaultenablecache,youcand......
kafka第五天学习笔记
今天我们继续学习Kafka的第五天内容。在前几天的学习中，我们了解了Kafka的基本概念、特点、应用场景以及核心组件等。今天我们将深入学习Kafka的一些高级特性和最佳实践。Kafka的复制机制Kafka的复制机制是其高可用性和数据安全性的重要保障。在Kafka中，每个主题都拥有一个或多个副本......
windows操作系统中如何将apache zookeeper安装为系统服务
记录一下，网上有些资料是错的，prunsrv的参数要以--开头！一下载最新版的apachecommonsdaemonhttp://archive.apache.org/dist/commons/daemon/binaries/windows/commons-daemon-1.3.4-bin-windows.zip解压，复制两个exe文件到zk的bin目录下二编写服务停止脚本（启动脚本不用自己......
xixa oraclelinux上kafka集群部署(一)----kafka安装
kafka部署前提：需要安装jdk1.7以上版本、zookeeper官网下载：http://kafka.apache.org/quickstartkafka配置配置server.properties文件中zookeeper配置，如果集群应该怎么配置？还需要尝试配置kafka集群在bin目录下面执行......
【kafka】Kafka压力测试
kafka自带的压测工具kafka-producer-perf-test.sh和kafka-consumer-perf-test.sh./bin/kafka-producer-perf-test.sh--topickafka-test--num-records10000--record-size1024--throughput-1--producer-propsbootstrap.servers=10.206.16.18:9092compression.t......
Apache Celeborn
ApacheCeleborn的背景ApacheCeleborn——快ApacheCeleborn——稳ApacheCeleborn——弹Evaluation一、背景大数据引擎的中间数据有两个来源:Shuffle和Spill，其中最重要的是Shuffle，据统计有超过15%的资源消耗在Shuffle。1.1传统Shuffle的问题下图右侧结构图是传统......
平安人寿基于 Apache Doris 统一 OLAP 技术栈实践
导读：平安人寿作为保险行业领军企业，坚持技术创新，以数据业务双轮驱动的理念和更加开放的思路来应对不断增长的数据分析和应用需求；以深挖数据价值、保障业务用数效率为目标持续升级大数据产品体系。自2022年起平安人寿开始引入开源实时数据仓库ApacheDoris并基于此统一OLAP技术......

Apache Kafka

Apache Kafka® 是一个分布式流处理平台. 这到底意味着什么呢?

相关文章

赞助商

阅读排行

Apache Kafka

Apache Kafka® 是 一个分布式流处理平台. 这到底意味着什么呢?

相关文章

赞助商

阅读排行

Apache Kafka® 是一个分布式流处理平台. 这到底意味着什么呢?