Flink是实时计算框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。
有界流和无界流都是基于Datastream这个Flink的编程模型。Flink自己管理内存机制,批流统一
Flink会自动识别运行模式,能以内存速度和任意规模进行计算.
Flink处理过程分为三步:source(输入),逻辑处理,sink(输出)
离线计算:批量,高延时,主动发起
实时计算:持续,低延时,事件触发
流处理,批处理 ,事件驱动应用: 窗口分类:
Event-time:事件时间 时间窗口:time
Lar-state:大的状态 计数窗口:count 又分为滑动,滚动
Exactly-once: 会话窗口:session
Flink面试常问问题:
1,Flink架构
2,Flink是怎么处理数据的
3,Flink与Spark的区别
4,Flink的常见算子
5,Flink的优化
6,Flink中的一些概念
Event-time,Large-state,Exactl-once,CEP,CDC/CPC
env.setparallelism(2)//设置并行度,默认为cpu线程数
与Sparkstreaming的区别:
spark中需要先运行map端,等到map端运行完成才会启动Reduce端----------mapReduce,
缺点:使用MR模型处理实时数据,延时比较高。
Flink任务启动,上下游任务同时启动,等待数据过来一条条启动-------------数据流模型/持续流模型
一个并行度,一个task
标签:窗口,计算,简单,模型,Flink,初识,延时,time From: https://www.cnblogs.com/ikssss/p/16897569.html