本书基于Flink1.13.X最新版本编写,作为Flink的入门书,主要使用函数式编程语言Scala进行讲解,知识面比较广,涵盖了当前整个Flink生态系统主流的大数据开发技术。内容全面,以实操案例为主,理论为辅,一步一步手把手对常用的Flink流处理、批处理、图计算等系统进行了深入讲解。
全书一共7章,第1章讲解了Flink的基础知识,包括Flink应用场景、主要组件、编程模型等,最后通过一个单词计数示例带领读者快速体验了Flink应用程序的编写;第2~3章讲解了Flink的多种运行时架构、任务调度原理、数据分区以及Flink集群的安装部署,同时包括Flink命令行操作、应用程序提交、常用Shell命令等;第4~7章讲解了Flink流式计算DataStream API、关系型计算Table&SQL API以及图计算框架Gelly等的基础知识、架构原理,同时包括常用Shell命令、API操作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、Kafka的整合操作。
本书可作为Flink新手入门的指导书籍,也可作为大数据开发人员的随身手册以及大数据从业者的参考用书。即使没有任何大数据基础的读者也可以对照书中的步骤成功搭建属于自己的Flink大数据集群,是一本真正的提高读者动手能力、以实操为主的入门书籍。读者学完本书可以独立使用Flink进行大数据项目的开发。