Flink 1.17教程：Standalone会话模式运行时架构及并行度

时间：2023-09-02 11:37:45浏览次数：47

标签：1.17 Standalone 容错性并行度任务并行任务算子计算资源

运行时架构——Standalone会话模式为例

Flink 1.17教程：Standalone会话模式运行时架构及并行度_大数据

并行度

并行度是指在计算过程中同时执行多个任务或操作的能力。在 Apache Flink 中，并行度是指同时执行作业中的多个任务或算子的能力。

并行度的引入是为了解决以下问题：

提高计算速度：通过将任务拆分成多个子任务，并行执行它们，可以大大提高计算速度。每个子任务都可以在不同的计算资源上独立执行，从而充分利用计算资源的并行处理能力。
处理大规模数据：当需要处理大规模数据时，单个任务可能会面临内存不足或处理时间过长的问题。通过将任务分成多个并行任务，可以将负载均衡到多个计算资源上，提高处理大规模数据的效率和可扩展性。
提高系统的容错性：并行度还可以提高系统的容错性。如果一个任务或算子失败，其他并行任务仍然可以继续执行，从而减少了整体作业的影响。

总的来说，通过并行度，可以将任务分解成更小的单元并同时执行它们，提高计算速度、处理大规模数据和提高系统的容错性。这是为了更好地利用计算资源、提高系统性能和处理大规模数据而引入的概念。

Flink 1.17教程：Standalone会话模式运行时架构及并行度_数据_02

一个特定算子的子任务（subtask）的个数被称之为其并行度（parallelism）。这样，包含并行子任务的数据流，就是并行数据流，它需要多个分区（stream partition）来分配并行任务。一般情况下，一个流程序的并行度，可以认为就是其所有算子中最大的并行度。一个程序中，不同的算子可能具有不同的并行度。
例如：如上图所示，当前数据流中有source、map、window、sink四个算子，其中sink算子的并行度为1，其他算子的并行度都为2。所以这段流处理程序的并行度就是2。

标签：1.17,Standalone,容错性,并行度,任务,并行任务,算子,计算资源
From： https://blog.51cto.com/zhangxueliang/7331330

Flink 1.17教程：历史服务器History Server
K8S运行模式容器化部署是如今业界流行的一项技术，基于Docker镜像运行能够让用户更加方便地对应用进行管理和运维。容器管理工具中最为流行的就是Kubernetes（k8s），而Flink也在最近的版本中支持了k8s部署模式。基本原理与YARN是类似的，具体配置可以参见官网说明，这里我们就不做过多讲解了......
Flink 1.17教程：并行度设置&优先级
并行度设置&优先级并行度（Parallelism）并行度的设置在Flink中，可以用不同的方法来设置并行度，它们的有效范围和优先级别也是不同的。代码中设置我们在代码中，可以很简单地在算子后跟着调用setParallelism()方法，来设置当前算子的并行度：stream.map(word->Tuple2.of(word,1L)).setParall......
Flink 1.17教程：算子链Operator Chain
算子链OperatorChain在ApacheFlink中，算子链（OperatorChaining）是将多个操作符（算子）连接在一起形成一个链式结构的优化技术。算子链的作用是将多个操作符合并为一个单一的任务单元，以减少通信开销、提高执行效率和减少资源占用。通俗来说，算子链的作用可以比喻为将多个操作合并成一......
Flink 1.17教程：Hadoop yarn会话运行模式
YARN运行模式_环境准备YARN上部署的过程是：客户端把Flink应用提交给Yarn的ResourceManager，Yarn的ResourceManager会向Yarn的NodeManager申请容器。在这些容器上，Flink会部署JobManager和TaskManager的实例，从而启动集群。Flink会根据运行在JobManger上的作业所需要的Slot数量动态分配T......
Flink 1.17教程：部署模式介绍及Standalone运行模式
部署模式介绍在一些应用场景中，对于集群资源分配和占用的方式，可能会有特定的需求。Flink为各种场景提供了不同的部署模式，主要有以下三种：会话模式（SessionMode）、单作业模式（Per-JobMode）、应用模式（ApplicationMode）。它们的区别主要在于：集群的生命周期以及资源的分配方式；以及应用的mai......
Flink 1.17教程：Hadoop yarn运行模式——单作业模式和应用模式
YARN运行模式_单作业模式单作业模式部署（1）执行命令提交作业YARN运行模式_应用模式应用模式同样非常简单，与单作业模式类似，直接执行flinkrun-application命令即可。如：bin/flinkrun-application-tyarn-application-ccom.atguigu.wc.WordCountStreamUnboundedDemo./FlinkTutorial......
Flink 1.17教程：命令行提交作业jar
命令行提交作业bin/flinkrun-mnode001:8081-ccom.atguigu.wc.WordCountStreamUnboundedDemo../jar/FlinkTutorial-1.17-1.0-SNAPSHOT.jar连接成功Lastlogin:FriJun1614:44:012023from192.168.10.1[atguigu@node001~]$cd/opt/module/flink/flink-1.17.0/[atgu......
Flink 1.17教程：集群搭建、运行模式（standalone/yarn/k8s）及历史服务器
集群角色集群启动如果是部署在本地，本地访问，无需进行任何配置，直接启动即可。如果是部署在服务器，需要远程访问，则需要将flink.conf中的localhost修改为服务器IP地址或是0.0.0.0节点服务器hadoop102hadoop103hadoop104角色JobManagerTaskManagerTaskManagerTaskManager[atguigu@node001......
Flink 1.17教程：WebUI提交作业及打jar包maven插件配置
打jar包maven插件配置<build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-shade-plugin</artifactId><version>3.2.4</version>......
Flink 1.17教程：集群角色及集群启动
集群角色集群启动如果是部署在本地，本地访问，无需进行任何配置，直接启动即可。如果是部署在服务器，需要远程访问，则需要将flink.conf中的localhost修改为服务器IP地址或是0.0.0.0节点服务器hadoop102hadoop103hadoop104角色JobManagerTaskManagerTaskManagerTaskManager[atguigu@node001......

Flink 1.17教程：Standalone会话模式运行时架构及并行度

运行时架构——Standalone会话模式为例

并行度

相关文章

赞助商

阅读排行