首页 > 其他分享 >flume知识点总结

flume知识点总结

时间:2023-07-14 09:24:25浏览次数:30  
标签:flume 知识点 sinks hdfs 总结 sink1 ## ag1

flume知识点总结

1.flume作用:从各种各样的数据源采集数据(读数据,缓存数据,写数据)到各种各样的文件系统中,如kafka

 

2.flume的采集程序:agent(包括source组件,channel组件,sink组件)

 

3.flume基本配置:(dir)

#定义三大组件的名称
ag1.sources = source1
ag1.sinks = sink1
ag1.channels = channel1

 

# 配置source组件
ag1.sources.source1.type = spooldir
ag1.sources.source1.spoolDir = /root/log/
ag1.sources.source1.fileSuffix=.FINISHED
ag1.sources.source1.deserializer.maxLineLength=5120

 

# 配置sink组件
ag1.sinks.sink1.type = hdfs
ag1.sinks.sink1.hdfs.path =hdfs://hdp-01:9000/access_log/%y-%m-%d/%H-%M
ag1.sinks.sink1.hdfs.filePrefix = app_log
ag1.sinks.sink1.hdfs.fileSuffix = .log
ag1.sinks.sink1.hdfs.batchSize= 100
ag1.sinks.sink1.hdfs.fileType = DataStream
ag1.sinks.sink1.hdfs.writeFormat =Text

 

## roll:滚动切换:控制写文件的切换规则
ag1.sinks.sink1.hdfs.rollSize = 512000 ## 按文件体积(字节)来切 
ag1.sinks.sink1.hdfs.rollCount = 1000000 ## 按event条数切
ag1.sinks.sink1.hdfs.rollInterval = 60 ## 按时间间隔切换文件

 

## 控制生成目录的规则
ag1.sinks.sink1.hdfs.round = true
ag1.sinks.sink1.hdfs.roundValue = 10
ag1.sinks.sink1.hdfs.roundUnit = minute

 

ag1.sinks.sink1.hdfs.useLocalTimeStamp = true

 

# channel组件配置
ag1.channels.channel1.type = memory
ag1.channels.channel1.capacity = 500000 ## event条数
ag1.channels.channel1.transactionCapacity = 600 ##flume事务控制所需要的缓存容量600条event

 

# 绑定source、channel和sink之间的连接
ag1.sources.source1.channels = channel1
ag1.sinks.sink1.channel = channel1

 

标签:flume,知识点,sinks,hdfs,总结,sink1,##,ag1
From: https://www.cnblogs.com/yangyanga/p/11893307.html

相关文章

  • 2023大数据面试总结
    先说些废话作为一个全栈开发工作者,曾经对公司专职的大数据开发有着浓厚的兴趣,所以尝试学习大数据开发所需要的各种技术栈。本文就是我在学习过程中记录下,所遇到的一些大数据面试的提问,仅供参考。当然,因为时间精力有限,并非所有的问题我都去记录了答案,如果您不了解某些问题或者不......
  • web前端 第五天总结
    案例1:js初体验<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>Document</t......
  • 概率期望做题方法总结
    1.概率其实我个人感觉我概率是非常不错的。常有的求解方法为a.定义法(发生次数/总次数)b.dp大法(常用于有顺序的应用题)c.然后就是乱搞贪心(也不失为一种选择)d.还有排列组合也有可能2.期望期望中,我对“无限不可列”的那种非常恼......
  • 7.13总结
    今天总结稍微累点,但也比较充实上午起来后学姐告诉我了视频需要修改的地方,有些目前还改不了,所以打算以后改,后来做了pta,好消息是达到了1500分,该写报告了。下午看了java的课,还是面向对象,学到了接口这个知识点,这个是c++没有的,简单来说是一种规则,而且可以类比成一个抽象类,这还是比较......
  • [总结]2023-7-13A组模拟赛
    [总结]2023-7-13A组模拟赛P1心路历程发现今天的题目描述很直接,比昨天的好懂。然后发现T2似乎是数据结构,好像找到了归宿,心里踏实了一点。之后就发现自己不会的计数题但是有两道:T1和T3。T4还以为是板子题,然后发现读不懂。于是就开始干T2(终于不是从T1开始做了!!!),一开始以为要用高级......
  • 7.13 周四总结
    今天跟着课程学了循环高级练习如何判断质数和猜数字小游戏。将之前的pta试题写进了实践报告中。完成了大道至简的部分阅读内容。今天暂无问题,明天继续抽出时间进行大道至简的阅读,并根据进度进行数组相关知识的学习。......
  • csapp二进制炸弹实验个人总结
    2023/7/13完成了这个实验,算是我的第一次逆向实战,对我来说很有挑战性。总结如下:1.对于汇编的熟练度,尤其是“层次”问题,mov0x8(%rsp),%rax和lea0x8(%rsp),%rax并不同;要注意某一个值本身是“地址”还是“数值”2.理解机器码工作原理后,拓宽思路,经验+寻找新的方法3.看待问题的视角......
  • consul 使用总结 & Nginx 负责均衡,最大连接数据,超时次数,超时等待时间,权重
    consul使用总结&Nginx负责均衡,最大连接数据,超时次数,超时等待时间,权重consulagnet-dev启动consul启动服务,注册服务:dotnetOrderServer.dll--urls="http://:5189"--ip="127.0.0.1“--port=5189dotnetOrderServer.dll--urls="http://:5188"--ip="127.0.0......
  • 这还不冲?Github上的大佬总结的2023经典大厂面试题,全会拿35k
    前言2023的上半年已经结束了,但是我发现有很多朋友没能拿到自己心仪的offer,其实并不是自身能力差,而且没有充足的准备面试。耗时一个月,收集了全网最热门的大厂面试题,我们程序员与别的行业不一样,除了上学的时候要做题,我们上班了找工作还得做题!我分享的结合目前互联网公司常见的面试考......
  • 助教工作总结(高级语言程序设计C语言)
    一、助教工作的具体职责和任务1、与老师的配合:协助老师指导两次课程设计协助老师指导蓝桥杯、天梯赛2、与课程其他助教的配合:共同解决同学们课后的疑问并将出现的重点问题反馈给老师安排大作业并进行相应的指导,最后进行批改评分将最终成绩反馈给老师一起挑选有深度的题......