Flink源码学习（4） TaskManager从节点启动分析

标签：slot 启动 Flink TaskManager 源码 TaskExecutor 节点

taskManager是flink的worker节点，负责slot的资源管理和task执行一个taskManager就是一台服务器的抽象 TaskManager基本资源单位是slot，一个作业的task会部署在一个TM的slot上运行，TM会负责维护本地的slot资源列表，并与Master和JobManager进行通信启动主类：TaskManagerRunner TaskManagerRunner.main() 启动函数：runTaskManagerProcessSecurely(args); Flink集群主节点和从节点，每个节点都有一个全局的唯一ID，叫ResourceID

load解析main方法参数和flink-conf.yaml配置信息
runTaskManagerProcessSecurely
TaskManager启动分三件事
Flink集群主从架构：JobManager，TaskManager ResourceManager（心跳，线程池）+taskExecutor（slot管理，task执行）不管是主节点JobManager还是从节点TaskManager除了关于资源管理和调度意外，还需要其他的服务 JobManager是逻辑概念上的主节点，实际上类叫clusterEntryPoint，然后具体叫JobMaster

Standalone

1个Yarn Container JobManager 启动ResourceManager 启动Dispatcher 其他的 Yarn Container TaskExecutor 应用程序提交的时候，启动一个JobMaster，再去调度StreamTask执行，向JobMaster汇报心跳 Dispatcher调度一个JobMaster，

TaskManager/TaskExecutor注册和心跳

总结：taskManager是一个逻辑抽象，代表一台服务器，启动必然会包含一些服务，另外包含一个TaskExecutor存在于内部，真实ide帮助Task Manager完成各种核心操作：

提交task
申请和释放slot

创建TaskManager实际上返回的是TaskExecutor TaskExecutor本身是RpcEndpoint的子类

TaskExecutor的初始化：
1. 初始化2个心跳管理器，jobManagerHeartbeat resourceManagerHeartbeat
2. hardware Description把硬件资源抽象成一个对象
```
this.hardwareDescription =
        HardwareDescription.extractFromSystem(taskExecutorServices.getManagedMemorySize());
```
onStart方法
1. 继承的RpcEndpoint，所以需要执行
2. 启动taskExecutorService
  1. 监控ResourceManager
    1. 连接ResourceManager
    2. 注册
    3. 维持心跳
    4. 当前TaskExecutor会监控RM的变更
  2. 启动TaskSlotTable服务
  3. 监控JobMaster
  4. 启动FileCache

标签：slot,启动,Flink,TaskManager,源码,TaskExecutor,节点
From： https://www.cnblogs.com/ak918xp/p/18130269

Flink源码学习（4） TaskManager从节点启动分析

TaskManager启动分三件事

启动基础服务

初始化taskManagerService

Standalone

TaskManager/TaskExecutor注册和心跳

相关文章

赞助商

阅读排行