首页 > 其他分享 >Flink调优初次笔记

Flink调优初次笔记

时间:2024-05-04 15:44:57浏览次数:22  
标签:resource 笔记 Flink yarn 调优 内存 JVM CPU

资源配置优化

从1.11开始,增加了一个通用客户端模式,(-t yarn-job)

TaskManager内存模型

Flink既使用堆内存,又使用堆外内存。

指定进程内存

JVM metaspace:JVM元空间,默认256M

JVM 执行内存:执行开销。有最小值和最大值。计算公式为:进程内存*0.1

框架内存:
堆内和堆外。不计入Slot的资源开销。

Task内存:执行用户代码使用的内存。
堆内:没有指定
堆外:默认关闭

内存大小:其他组件分配完后,其余都是Task内存。

网络缓冲内存(属于堆外):用于数据交换
三个参数:比例(0.1),最小值(64M),最大值(1G);
是Flink的总内存(进程内存-JVM内存)

托管内存:比例(0.4),Flink内存。
可以指定具体的大小(默认是none)。

yarn配置文件

capacity-scheduler.xml 这个文件里面有个默认的策略:

  <property>
    <name>yarn.scheduler.capacity.resource-calculator</name>
    <value>org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator</value>
    <description>
      The ResourceCalculator implementation to be used to compare
      Resources in the scheduler.
      The default i.e. DefaultResourceCalculator only uses Memory while
      DominantResourceCalculator uses dominant-resource to compare
      multi-dimensional resources such as Memory, CPU etc.
    </description>
  </property>

这个策略只会考虑内存。不会考虑CPU。CPU默认为1

需要将这个value换成这个:
<value>org.apache.hadoop.yarn.util.resource.DominantResourceCalculator</value>
这个策略会考虑CPU资源。我们在提交时指定的CPU数量才会生效。

slot只会隔离内存。不会隔离CPU。也就是说,slot共享CPU。

Flink反压

两个算子A,B。
A有ResultPartition
B有InputGet

反应的场景:数据洪峰、垃圾回收停顿

对算子指定UUID。
如果不指定UUID的话,会有可能造成下面的情况:
从保存点开启新任务时。会导致映射失败。

链路延迟

可以在普罗米修斯里面监控到。在webUI里面死活没有

对象重用

设置TTL

开启MiniBatch:减少对state的访问。减少数据的输出量

LocalGlobal : 用于数据倾斜

标签:resource,笔记,Flink,yarn,调优,内存,JVM,CPU
From: https://www.cnblogs.com/lhk20213937/p/18172373

相关文章

  • Raft论文阅读笔记.18171971
    本文是对Raft论文阅读后的一些核心内容总结原论文:InSearchofanUnderstandableConsensusAlgorithm(ExtendedVersion)Raft概览Raft论文中用几个表格给出了Raft的细节概览,这里不用仔细阅读,后面学习的时候会慢慢深刻的理解这些内容server持有的状态RPC原语server规......
  • 博客性能优化笔记 | 99分
    闲着没事,拿lighthouse测了一下博客网站的性能评测,发现诊断出的问题还挺多,就顺手优化了一下。这篇文章将记录这个优化的过程。优化前后对比lighthouse检测结果优化前优化后性能面板检测结果FCPDOMContentLoadedLCP优化前764ms1798ms1864ms......
  • Razavi - RF Microelectronics的笔记 - Current-Driven Passive Mixer
    Onpage367,whilediscussingaboutcurrent-drivenpassivemixer,thereisthissaying:theswitchesinFig.6.39(b)alsomixthebasebandwaveformswiththeLO,deliveringtheupconvertedvoltagestonodeA.Iamquiteconfusedonwheredoesthiswave......
  • 统一场理论公式推导和笔记——part6
    三十九,统一场论能量方程1,能量的定义:能量是质点在空间中【或者质点周围空间本身】相对于我们观察者在某个空间范围内【由于时空同一化,也可以说在某一个时间段内】运动的运动量。能量和动量的定义是类似的,反映质点和空间相对于我们观察者的运动程度,所不同的是,动量是矢量,能量是标......
  • 统一场理论公式推导和笔记——part5
    三十七,运动电荷的磁场产生引力场1,匀速直线运动电荷的磁场产生引力场统一场论核心是变化的引力场可以产生电场,反过来,变化的电磁场也可以产生引力场。==》根据爱因斯坦的广义相对论,变化的电磁场确实可以产生引力场,尽管理论上变化电磁场会产生引力场,但由于电磁场的能量相对较小,......
  • FFmpeg开发笔记(十八)FFmpeg兼容各种音频格式的播放
    ​FFmpeg结合SDL可以播放音频文件,也能播放视频文件中的音频流,《FFmpeg开发实战:从零基础到短视频上线》一书第10章的示例程序playaudio.c支持播放mp3和aac两种格式的音频,却不支持播放其他格式的音频。因为mp3和aac两个格式拥有标准的规范定义,比如mp3规定每帧音频固定包含1152个样......
  • docker简单笔记
     这里不说基础概念的东西,直接上车出发 指令 docker-compose--help docker-composeup   会自动下载运行依赖,然后跑到容器隔离环境中docker-composedown--rmiall   删除由DockerCompose管理的所有容器 安装(我的版本20.10.5) 简单例子 如果遇......
  • [笔记]树形dp
    树形dp,是一种建立在树形结构上的dp,因此dfs一般是实现它的通用手段。是一种很美的动态规划呢。P1352没有上司的舞会P1352没有上司的舞会。在一棵树中,找到若干个互相独立(即互相没有边直接相连)的点,使它们的权值和最大。我们发现,间隔选择的方法(只选深度为奇数/偶数的点)是不可......
  • 多项式模板学习笔记
    多项式乘法存在多项式\(F(z)=\sum_{i=0}^na_iz^i,G(z)=\sum_{i=0}^mb_iz^i\),我们定义多项式乘法:\[F(z)*G(z)=\sum_i\sum_ja_ib_jz^{i+j}\]多项式的点值表达一个\(n\)次函数可以用平面上的\(n+1\)个点来表达。所以我们可以把一个\(n\)次多项式从系数表达转化成\(n+......
  • ffmpeg常用API笔记
    1.ffmpeg日志系统<libavutil/log.h>1)av_log_set_level(AV_LOG_DEBUG)2)av_log(NULL,AV_LOG_INFO,"fmt...",op) 2.<libavformat/avformat.h>操作目录:1)avio_open_dir()打开一个目录。结构体AVIODirContext,表示目录的上下文信息。//参数1:上下文;参数2:要访问的目录的ur......