首页 > 其他分享 >flume使用教程

flume使用教程

时间:2024-07-30 16:09:13浏览次数:8  
标签:flume hdfs 教程 sinks a1 k1 conf 使用 c1

1.

启动端口

   nc node101 55555

监听端口

   nc -l 55555

 

job下配置文件

# example.conf: A single-node Flume configuration

 

# Name the components on this agent

a1.sources = r1

a1.sinks = k1

a1.channels = c1

 

# Describe/configure the source

a1.sources.r1.type = netcat

a1.sources.r1.bind = localhost 

a1.sources.r1.port = 44444

 

# Describe the sink

a1.sinks.k1.type = logger

 

# Use a channel which buffers events in memory

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

 

# Bind the source and sink to the channel

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

 

 

 

启动服务

bin/flume-ng agent --conf conf --conf-file job/log_to_console.conf --name a1

控制台打印

bin/flume-ng agent --conf conf --conf-file job/log_to_console.conf --name a1 -Dflume.root.logger=INFO,console

 

 

杀死进程 kill -9  端口号

数据生成

 

创建日志文件

Hello.log

创建生成器

Write.sh

运行生成器  sh write.sh

查看数据文件:tail -F hello.txt

 

控制太配置

修改配置

a1.sources.r1.type = exec

a1.sources.r1.command = tail -F /var/log/secure

 

增加配置 hdfs配置

a1.channels = c1

a1.sinks = k1

a1.sinks.k1.type = hdfs

a1.sinks.k1.channel = c1

a1.sinks.k1.hdfs.path = hdfs:node101:8020/flume/events/%Y-%m-%d/%H%M/%S

a1.sinks.k1.hdfs.filePrefix = events-

a1.sinks.k1.hdfs.round = true

a1.sinks.k1.hdfs.roundValue = 10

a1.sinks.k1.hdfs.roundUnit = minute

 

 

  1. 写日志文件
  2. 写数据生成器
  3. 写flume配置文件
  4. 启动hdp.sh hdfs
  5. 启动hdp.sh yarn
  6. 启动flume

标签:flume,hdfs,教程,sinks,a1,k1,conf,使用,c1
From: https://www.cnblogs.com/xwchengc/p/18332675

相关文章

  • 使用Nginx Proxy Manager配置Halo的反向代理和申请 SSL 证书
    本文介绍NginxProxyManager配置Halo的反向代理和申请SSL证书,如需要了解Halo2的安装,参考如何在Linux云服务器上通过DockerCompose部署安装Halo,搭建个人博客网站?。目录安装NginxProxyManagerNginxProxyManager安装新建docker-compose.yaml启动NPM配置Halo的反向代理申......
  • 从CNN到Transformer:基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分
    原文链接:从CNN到Transformer:基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分割和点云分类教程https://mp.weixin.qq.com/s?__biz=MzUzNTczMDMxMg==&mid=2247610610&idx=5&sn=f973c3e430c89d6123ca8f4892086c55&chksm=fa827115cdf5f8036ef8111c6f06cf592a8c0587......
  • Scrapy 爬取旅游景点相关数据(六):代理使用
    本期内容:(1)继续完善评论数据的爬取(2)代理的使用1创建数据库表上期我们只打印了爬取到的数据,并没有入库,保存到数据,先执行以下SQL:CREATETABLEtb_comment(idINTAUTO_INCREMENTPRIMARYKEYCOMMENT'自增主键',tidVARCHAR(255)COMMENT'景点ID',......
  • 使用Seata XA模式的全局事务管理在SpringCloud电商订单系统中的应用
    在开发电商系统的过程中,订单创建是一项非常关键的功能。本文将介绍如何在订单创建过程中,结合SpringCloud和Seata的XA模式来实现全局事务管理,以确保数据的一致性和完整性。订单创建过程详解在这段代码中,我们通过@GlobalTransactional注解来声明一个全局事务。以下是具体的......
  • 使用python从网站自动下载pdf时出错
    我想从一个名为epadossier.nl的网站自动批量下载pdf我用谷歌搜索了这个并找到了一段代码并修复了一个小错误。所以现在我得到了这个`importrequestsurl="https://www.epadossier.nl/adres/plaats/straat/num"response=requests.get(url)ifresponse.status_cod......
  • 如何使用 PIPE 并行运行 python 子进程?
    我正在使用inkscape将一堆SVG图像转换为PNG。单线程:importsubprocessimporttimeimportosinkscape_path=r'C:\ProgramFiles\Inkscape\bin\inkscape.com'steps=30filenames=[]processes=[]#t_start=time.process_time()t_start=time.time()f......
  • git简单使用总结
    概述Git是一种分布式版本控制系统。要想深刻理解Git的工作原理,需要理解理解Git的三个存放区域:本地工作目录、暂存区和仓库,也可以称为三棵树,不过在仓库这个地方又可以分为本地仓库和远程仓库。WorkingDirectory:本地工作目录(工作区)Stage(Index):暂存区Reposi......
  • 【数据结构】你该在什么情况下使用 LindedList
    什么是Java的LinkedList?LinkedList是Java集合框架中的一个类,位于java.util包中。它实现了List接口,并且是一个双向链表结构,可以高效地进行插入和删除操作。主要特点双向链表:每个节点包含指向前一个节点和后一个节点的引用。动态大小:链表的长度可以根据需要动态......
  • 热烈欢迎“鹏粤”选择使用订单日记
    感谢广州鹏粤交通设施有限公司选择使用订单日记!广州鹏粤交通设施有限公司,成立于2016年,位于广州市白云区,是一家专业从事加工钢结构材料、交通标志板材料、声屏障材料、中分带开口活动护栏、防撞垫等产品为主的企业。在业务不断壮大的过程中,想使用一种既能提升运营效率又能......
  • Docker中使用自定义网络方式实现Redis集群部署与测试流程
    场景Docker中Docker网络-理解Docker0与自定义网络的使用示例:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/140788458参考上面的流程实现自定义网络的实现。下面记录其应用实例,使用Docker的自定义网络实现redis集群部署。注:博客:https://blog.csdn.net/badao_......