目录
Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?
Flink中的窗口函数(Window Function)是什么?
Flink的DataStream API和Table API有何区别?
Flink支持哪些数据源(Source)和数据汇(Sink)?
Flink的UCR(Unbounded Continuous Rows)是什么?
Flink的广播变量(Broadcast Variable)是什么?
Flink中的流水线并行执行(Pipeline Parallelism)是什么?
Flink的前后台压力(Front and Back Pressure)是什么?
Flink中的时间特征(Time Characteristics)有哪些选项?
Flink如何处理事件时间(Event Time)处理中的乱序事件?
Flink的连续处理(Continuous Processing)和迭代处理(Iterative Processing)有何区别?
Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?
在Flink中,时间语义是流处理的核心概念之一,主要分为事件时间(Event Time)和处理时间(Processing Time)。这两种时间语义决定了时间戳的生成方式和处理逻辑。
事件时间是指数据产生的时间,这个时间戳通常由数据生成源在数据生成时附加上去,是数据固有的属性。使用事件时间可以保证即使在分布式系统中,数据的时序性也能保持一致,这对于需要全局时间一致性的计算场景非常重要。事件时间是处理乱序事件和延迟数据的关键,它允许系统在处理过程中对数据进行重新排序,确保即使在网络延迟或系统故障的情况下,也能获得一致的处理结果。
处理时间则是指数据被Flink处理节点实际处理的时间。这种时间语义更依赖于系统的处理能力,它的优点是处理延迟较低,因为不需要等待全局同步的时间戳。然而ÿ
标签:面试题,窗口,处理,Flink,如何,时间,Time,参考答案 From: https://blog.csdn.net/linweidong/article/details/139727283