教程简介
Flume是Apache下面的一个分布式组件,它提供高效,可靠的收集,整合,传输日志数据的服务。Flume可以理解成一个管道,它连接数据的生产者和消费者,它从数据的生产者(Source)获取数据,保存在自己的缓存(Channel)中,然后通过Sink发送到消费者。它不对数据做保存和复杂的处理(可以做简单过滤和改写)。
Apache Flume入门教程 - 从基本到高级概念的简单步骤了解Apache Flume,其中包括简介,Hadoop中的数据传输,架构,数据流,环境,配置,获取Twitter数据,序列生成器源,NetCat源。
教程目录
- Apache Flume教程
- Apache Flume - 简介
- Apache Flume - Hadoop中的数据传输
- Apache Flume - 架构
- Apache Flume - 数据流
- Apache Flume - 环境
- Apache Flume - 配置
- Apache Flume - 获取Twitter数据
- Apache Flume - 序列发生器源
- Apache Flume - NetCat Source
- Apache Flume - 有用的资源