首页 > 其他分享 >flume采集数据到kafka脚本编写

flume采集数据到kafka脚本编写

时间:2024-07-25 19:55:49浏览次数:15  
标签:flume opt -- module kafka a1 编写

3.2.1 数据采集
思路:
a) 配置kafka,启动zookeeper和kafka集群;
b) 创建kafka主题;
c) 启动kafka控制台消费者(此消费者只用于测试使用);
d) 配置flume,监控日志文件;
e) 启动flume监控任务;
f) 运行日志生产脚本;
g) 观察测试。
1)启动zookeeper,kafka集群
$/opt/module/kafka/bin/kafka-server-start.sh /opt/module/kafka/config/server.properties
2)创建kafka主题
$ /opt/module/kafka/bin/kafka-topics.sh --zookeeper hadoop102:2181 --topic calllog –-create --replication-factor 1 --partitions 3
检查一下是否创建主题成功:
$ /opt/module/kafka/bin/kafka-topics.sh --zookeeper hadoop102:2181 --list
3)启动kafka控制台消费者,等待flume信息的输入
$ /opt/module/kafka/bin/kafka-console-consumer.sh --zookeeper hadoop102:2181 –topic
calllog --from-beginning
4)配置flume(flume2kafka.conf)

define
a1.sources = r1
a1.sinks = k1
a1.channels = c1

source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F -c +0 /opt/module/calllog/calllog.csv
a1.sources.r1.shell = /bin/bash -c

sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.bootstrap.servers = hadoop101:9092,hadoop102:9092,hadoop103:9092
a1.sinks.k1.kafka.topic = calllog
a1.sinks.k1.kafka.flumeBatchSize = 20
a1.sinks.k1.kafka.producer.acks = 1
a1.sinks.k1.kafka.producer.linger.ms = 1

channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100bind
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
5)启动flume
$ /opt/module/flume/bin/flume-ng agent --conf /opt/module/flume/conf/ --name a1 --conf-file /home/tujia/calllog/flume2kafka.conf
6)运行生产日志的任务脚本,观察kafka控制台消费者是否成功显示产生的数

标签:flume,opt,--,module,kafka,a1,编写
From: https://blog.csdn.net/2301_80989898/article/details/140653223

相关文章

  • 卡夫卡(Kafka)框架详解:从背景到应用实践
    卡夫卡(Kafka)框架详解:从背景到应用实践引言        在大数据和分布式系统日益普及的今天,数据处理和消息传递成为了支撑复杂业务系统的关键基础设施。ApacheKafka,作为一个高性能的分布式消息队列系统,因其高吞吐量、低延迟和可扩展性,成为了众多企业和开发者首选的消息......
  • 油管视频《编程思维》中的题目,使用C语言编写出来,第二集,反抗
    题目,假设要在人群中找一位领袖,领袖的相关信息有,他的眼睛是绿色的,如果他长着红头发,名字至少两个连续字母相同,如果戴眼镜的话,名字中有且仅有2个元音,否则名字中会有三个元音,只有一人附和以上条件,请下达指令涉及编程的基础原理1,结构体的使用,用于存储每个人的信息2,字符串的处理,......
  • 油管视频《编程思维》中的题目,使用C语言编写出来,第三集,炉膛机器人
    题目:假设起初只有一个机器人,他的炉膛里有一个数字0,和另一个未知的任意生成的编码,随着推移,原始机器人自我复制,制造出更多一样的炉膛机器人,被原始机器人自我复制制造出的每一个子机器人的熔炉内,都继承了原始机器人未知的编码,并且有一个属于自己,独一无二的编码刻在外壳,第二代炉膛......
  • 02-2 【编写loader工程内容】检测内存容量
    方法:利用BIOS中断来检测内存容量,具体是BIOSINT0x15(或INT15H)具体使用方法:参考文档链接:https://wiki.osdev.org/Detecting_Memory_(x86)实操(1)首先定义一个结构体因为内存是分成好多块的,有一些是已经被硬件占用了:因此检测内存返回的结构体应该是个结构体数组......
  • RestSharp编写api接口测试,并实现异步调用(不卡顿)
    首先,确保你已经安装了RestSharpNuGet包。如果没有安装,可以通过以下命令安装:bashInstall-PackageRestSharp然后,在你的C#代码中,你可以按照以下步骤操作:引用RestSharp命名空间。创建一个RestClient实例。创建一个RestRequest实例,并设置请求方法和URL。执行异步POST请求。......
  • Airflow 2.7.2 触发badld编写的代码块 Triggerer的异步线程
    我正在运行Airflow版本2.7.2,并且我不断地在触发器日志中看到该问题。Triggerer'sasyncthreadwasblockedfor0.50seconds,likelybyabadly-writtentrigger.SetPYTHONASYNCIODEBUG=1togetmoreinformationonoverrunningcoroutines.我的触发器运行函数是......
  • Apache Kafka 使用详解
    文章目录引言官网链接Kafka原理核心概念工作原理基础使用安装与启动生产者示例消费者示例高级使用KafkaStreams示例:单词计数KafkaConnect示例:使用KafkaConnect将MySQL数据导入Kafka优缺点优点缺点结论引言ApacheKafka是一个分布式流处理平台,由LinkedIn......
  • C++学习笔记(01)——使用VS Code进行C++函数分文件编写
    首先需要下载安装:C/C++ProjectGenerator扩展,就是下图这玩意:下载安装完成后,按ctrl+shift+p打开命令面板,输入createC++project,按回车后可以选择保存工程的文件夹创建好会后生成几个目录:.vscode:里面放一些配置文件之类的,如launch.json、setting.json、tasks.jsoninclude:存......
  • 04-【编写loader工程内容】利用内联汇编显示字符串
    在开发操作系统过程中,有时必须使用某些特殊的指令(如inb/outb/hlt),而C编译器无法自动使用这些指令。因此,如果要使用这些指令,有两种方式:1.在汇编文件中为该指令的使用创建汇编函数(子程序),然后在C代码中以函数调用的方式去使用;2.使用内联汇编:即在C代码中嵌入汇编程序。......
  • ref和reactive分别编写的计数器
    使用ref函数和reactive函数写的技术器小程序,ref的实现用到了reactive,推荐使用ref,代码点击查看代码<script>//setup是组合是API的体现import{reactive,ref}from'vue'exportdefault{setup(){conststatus=reactive({count:0})......