首先,从 Hadoop 开始入门学习,因为它是整个大数据生态圈的基石,其它框架都直接或者间接依赖于 Hadoop。Hadoop 包括:分布式文件系统 HDFS、计算框架 MapReduce、资源调度 YARN。
接下来,更加深入学习主流的混合处理框架 Spark 和 Flink。
其次,Zookeeper、Hive、Kafka、HBase 都是具有代表性的大数据框架,都是必备的技术栈。
最后,至于其它框架,并没有特定的先后顺序,如果时间有限,对同一类型的框架先深入掌握一种即可。
首先,从 Hadoop 开始入门学习,因为它是整个大数据生态圈的基石,其它框架都直接或者间接依赖于 Hadoop。Hadoop 包括:分布式文件系统 HDFS、计算框架 MapReduce、资源调度 YARN。
接下来,更加深入学习主流的混合处理框架 Spark 和 Flink。
其次,Zookeeper、Hive、Kafka、HBase 都是具有代表性的大数据框架,都是必备的技术栈。
最后,至于其它框架,并没有特定的先后顺序,如果时间有限,对同一类型的框架先深入掌握一种即可。