HDFS:分布式存储
YARN:计算资源调度
MapReduce:离线计算(基于磁盘)
Tez:构建有向无环图
Spark:基于内存计算
Hive:数据仓库(历史记录)
Pig:流数据处理(轻量级的脚本语言)
Oozie:作业流调度系统
Zookeeper:分布式协调服务
HBase:列族数据库
Flume:日志收集分析框架
Sqoop:数据导入导出
Ambari:部署工具
标签:基于,项目,离线,调度,Hadoop,结构,计算资源,分布式 From: https://www.cnblogs.com/lin513/p/17489862.html