简单理解Flume之Source

时间：2024-05-28 15:01:53浏览次数：25

标签：Flume sources s1 a1 Source 理解 c1 监听

Source

AVRO Source

1，AVRO Source监听指定端口，接收被AVRO序列化之后的数据

2，结合AVRO Sink可以实现多级扇入扇出流动

a1.sources = s1
a1.channels = c1
a1.sinks = k1

# 配置AVRO Source
a1.sources.s1.type = avro
# 要监听的主机名或者IP地址
a1.sources.s1.bind = hadoop01
# 要监听的端口
a1.sources.s1.port = 8888

a1.channels.c1.type = memory

a1.sinks.k1.type = logger

a1.sources.s1.channels = c1
a1.sinks.k1.channel = c1

Spooling Directory Source

1，Spooling Directory Source监听指定的目录，如果目录中产生新的文件，那么自动收集新文件中的内容

a1.sources = s1
a1.channels = c1
a1.sinks = k1

# 配置Spooling Directory Source
a1.sources.s1.type = spooldir
# 要监听的目录
a1.sources.s1.spoolDir = /opt/flume_data
# 被收集完的文件的后缀
a1.sources.s1.fileSuffix = .finished

a1.channels.c1.type = memory

a1.sinks.k1.type = logger

a1.sources.s1.channels = c1
a1.sinks.k1.channel = c1

Taildir Source

1，可以利用Exec Source监听指定文件，利用Spooling Directory Source监听指定目录，Tairdir Source监听一组或多组问价

2，Taildir Source不支持在Windows系统使用

a1.sources = s1
a1.channels = c1
a1.sinks = k1

# 配置Taildir Source
a1.sources.s1.type = TAILDIR
# 给要监听的文件组起名
a1.sources.s1.filegroups = f1 f2
# 要监听的文件名
# 监听指定目录下所有的txt文件
a1.sources.s1.filegroups.f1 = /opt/flume_data/.*txt.*
# 监听指定目录下所有的log文件
a1.sources.s1.filegroups.f2 = /opt/flume_data/.*log.*
# 索引文件的存储位置
a1.sources.s1.positionFile = /opt/flume_data/taildir_position.json


a1.channels.c1.type = memory

a1.sinks.k1.type = logger

a1.sources.s1.channels = c1
a1.sinks.k1.channel = c1

HTTP Source

1，HTTP Source监听HTTP请求，将请求的内容作为日志进行收集

2，HTTP Source只能监听GET和POST请求，GET请求监听不稳定，所以一般只用于监听POST请求

a1.sources = s1
a1.channels = c1
a1.sinks = k1

# 配置HTTP Source
a1.sources.s1.type = http
# 要监听的端口
a1.sources.s1.port = 8080

a1.channels.c1.type = memory

a1.sinks.k1.type = logger

a1.sources.s1.channels = c1
a1.sinks.k1.channel = c1

Custom Source

1，Flume中，自定义Source分为两种

被动型Source，需要用户自己定义线程来获取并封装相数据

主动型Source，提供了线程获取数据，用户只需要考虑怎么封装数据

2，实际过程中，还需要考虑获取数据文件中的属性，所以还需要实现Configurable接口

标签：Flume,sources,s1,a1,Source,理解,c1,监听
From： https://blog.csdn.net/m0_63130425/article/details/139191839

如何理解Spring Boot自动配置原理和应用？
我们知道，基于SpringBoot，我们只需要在类路径中引入一组第三方框架的starter组件，就能在Spring容器中使用这些框架所提供的各项功能。这在当下的开发过程中已经习以为常，但在SpringBoot还没有诞生之前却是不可想象的。如果我们使用传统的Spring框架，那就需要添加各种繁杂的配置信......
u-boot启动流程(好难理解啊！！！)
链接脚本u-boot.lds详解要分析uboot的启动流程，首先要找到“入口”，找到第一行程序在哪里。程序的链接是由链接脚本来决定的，所以通过链接脚本可以找到程序的入口。如果没有编译过uboot的话链接脚本为arch/arm/cpu/u-boot.lds。打开u-boot.lds可以看到下图所示的内容。OU......
如何理解信息隐藏和局部化?
信息隐藏是指将秘密信息隐藏于可公开的媒体信息中，使人们凭直观的视觉和听觉难以察觉其存在的技术。信息隐藏技术主要关注如何隐藏信息的内容和存在，而不仅仅是内容。信息隐藏技术被广泛应用于军事、情报、政府机要部门等领域，以保护机密信息的安全。局部化是分式环的另一名称，通常......
关于Embedded Resource的理解
EmbeddedResource.NET中使用外部资源时常用的方式都是使用资源文件，作为程序集的一部分发布。资源文件的读取也比较方便，字符串、图片和任何二进制数据，包括任何类型的文件都可以作为资源的项。使用资源文件时VS也会自动生成相应的方法来获取资源，用xml编辑器打开后缀.resx的文件，......
Nginx R31 doc-13-Limiting Access to Proxied HTTP Resources 访问限流
前言大家好，我是老马。很高兴遇到你。我们为java开发者实现了java版本的nginxhttps://github.com/houbb/nginx4j如果你想知道servlet如何处理的，可以参考我的另一个项目：手写从零实现简易版tomcatminicat手写nginx系列如果你对netty不是很熟悉，可以读一下从......
Web Service和Web API理解和使用场景
WebService理解：WebService是一种基于网络的服务，它使用标准化的消息传递协议，最典型的是基于SOAP（SimpleObjectAccessProtocol）协议。SOAP使用XML格式封装数据，定义了消息的结构和传输方式，因此它是一个重量级的解决方案。WebService支持跨平台、跨语言的通信，常用于企业内......
链表6（法二好理解）------ 7-6 sdut-C语言实验-有序链表的归并分数 20
7-6sdut-C语言实验-有序链表的归并分数20全屏浏览切换布局作者马新娟单位山东理工大学分别输入两个有序的整数序列（分别包含M和N个数据），建立两个有序的单链表，将这两个有序单链表合并成为一个大的有序单链表，并依次输出合并后的单链表数据。输入格式:第一行输入M与......
IDEA resource下的文件夹内的配置文件不生效，但resource下的配置生效
问题：我的resource如图所示，运行时发现只有resource下的application.yml被识别到了，但bak里的三个配置没有生效解决：在projectstructure中打开molude，打开resource，选中其下不起作用的文件夹，如图中的bak，将其选为resource资源文件，即点击下图位置之后再重新运行，可以发现bak......
CAS单点登录原理解析（转载）
1、基于Cookie的单点登录的回顾基于Cookie的单点登录核心原理：将用户名密码加密之后存于Cookie中，之后访问网站时在过滤器（filter）中校验用户权限，如果没有权限则从Cookie中取出用户名密码进行登录，让用户从某种意义上觉得只登录了一次。该方......
【Python】 XGBoost模型的使用案例及原理解析
原谅把你带走的雨天在渐渐模糊的窗前每个人最后都要说再见原谅被你带走的永远微笑着容易过一天也许是我已经老了一点那些日子你会不会舍不得思念就像关不紧的门空气里有幸福的灰尘否则为何闭上眼睛的时候又全都想起了谁都别说让我一个人躲一躲你的承诺我竟......