首页 > 其他分享 >15条 Karpenter 最佳实践,轻松掌握弹性伸缩

15条 Karpenter 最佳实践,轻松掌握弹性伸缩

时间:2024-12-27 10:54:37浏览次数:3  
标签:负载 伸缩 15 中断 实例 Karpenter Pod 节点

Karpenter 是一款高性能、灵活的开源 Kubernetes 集群自动扩展工具,目前已支持 AWS 和阿里云。它可以根据不断变化的应用负载,快速启动大小合适的计算资源,进而提升应用的可用性。

相较于 Cluster Autoscaler,Karpenter 的灵活、易用、细粒度控制和高度自动化是一项重大升级,可帮助您更快速地调整资源、高效扩展和持续优化。

今年年中,Karpenter 发布了 1.0 版本,意味着该项目已 GA。因此现在是一个采用 Karpenter 的绝佳时机。

平均仅需 20 分钟即可完成迁移

通过 EKS 托管的节点组和 Fargate 迁移至 Karpenter 十分简单,并且由于它与现有的 Kubernetes 集群兼容,并能利用标准的 Kubernetes 资源,因此可将中断降至最低。

关于迁移的细节,我们将在后续的文章中详细说明。欢迎关注「CloudPilot AI」

Karpenter 配置的最佳实践

CloudPilot AI 构建在 Karpenter 之上,研发团队的核心成员是 Karpenter 项目的首批开发者,因此我们对 Karpenter 颇为了解。以下是关于 Karpenter 配置的最佳实践:

使用 Fargate 或专门的节点组

在 EKS Fargate 或专门的节点组上运行 Karpenter 控制器可以避免管理冲突和资源竞争。如果控制器运行在它所管理的节点上,可能会不小心缩减这些节点,从而导致系统不稳定。通过使用 EKS Fargate,控制器与托管节点保持独立,确保了稳定的可用性和性能。另一种选择是使用专用节点组,将控制器与应用程序工作负载隔离,进一步防止资源竞争,从而提高可靠性。

使用 Pod 中断预算(PDB)

Karpenter 会在其正常操作过程中请求调度器销毁节点。确保服务可靠性的唯一方法是向调度器告知每个 Deployment 或 StatefulSet 的需求。

中断预算对于在更新或扩展操作期间维持应用程序可用性至关重要,它通过限制任何时刻可以中断的 pod 数量来实现。这有助于通过避免同时终止过多 pod 来防止服务停机。此外,中断预算帮助平衡运维和稳定性,确保在进行必要更新的同时,至少有部分 pod 继续运行,从而确保 Kubernetes 环境的可靠性和稳定性。

避免使用自定义启动模板

Karpenter 的指导手册建议避免使用自定义启动模板,因为它们不支持节点的自动升级、跨架构支持或安全组发现。

与其使用启动模板,您可以在 AWS 节点模板中使用自定义用户数据,或者直接添加自定义 AMI。

在节点池中配置节点过期

使用 Karpenter,您可以设置在指定时间后自动使节点过期,而不会导致任何停机。这样可以确保所有节点始终运行最新的安全补丁,提升系统的安全性和稳定性。

根据工作负载类型设置节点池

有状态工作负载对节点变动的容忍度较低,因此建议为这类工作负载设置仅使用按需实例的配置器。而对于无状态且容错性强的工作负载,可以设置一个仅使用 Spot 实例的节点池。

为 GPU 工作负载或通用计算创建特定的节点池

为 GPU 工作负载或通用计算创建专门的节点池,可以更好地分配和优化资源。对于 GPU 密集型任务,配置了 GPU 实例的节点池可以确保这些专用资源的可用性和高效利用。

有趣的是,GPU 实例有时比通用计算实例更便宜。这种成本优势意味着,只要正确配置节点池和工作负载,您也可以将 GPU 实例用于常规工作负载。这样的灵活性不仅能降低成本,还能确保工作负载与适当的硬件匹配,避免资源竞争,并通过为不同类型的工作负载提供独立的扩展策略和配置,简化管理。

为您的 Deployment/Pod 指定资源

Karpenter 会根据 Pod 的资源请求进行计算,因此必须为 Deployment/Pod 指定资源。如果不指定资源,可能会导致集群扩展时出现问题。

将 Pod 分布在多个节点和可用区

将 Pod 分布在多个节点和可用区可以增强 Kubernetes 应用的韧性和可用性。通过分散 Pod 的位置,可以最小化单点故障对服务的影响,因为如果某个节点或可用区出现故障,工作负载仍可以在其他节点或可用区继续运行。

Karpenter 通过动态地在不同的可用区配置节点来自动化这种分布,确保负载均衡和资源使用的优化。通过结合 Pod 拓扑约束,Karpenter 确保 Pod 按照指定规则进行部署,避免资源争抢,提升性能和可靠性,即使在节点或可用区发生故障时,也能保持服务不中断。

优先使用 Savings Plans 或预留实例

通过为特定的节点池配置较高的权重并设置实例限制,Karpenter 可以在切换到按需实例或其他实例类型之前,优先使用这些更具成本效益的资源。这种策略帮助您最大化预留容量并节省成本,同时保持扩展的灵活性。

在按需实例和 Spot 实例之间进行分配

此配置允许您创建一个混合实例设置,其中一定比例的 EKS 节点使用按需实例,其余部分使用 Spot 实例。这种设置非常适合那些能容忍中断并且能够从 Spot 实例的成本优势中受益的工作负载。

实现这一配置的方法是,您为 Spot 实例和按需实例分别创建节点池,并为一个名为 capacity-spread 的新标签分配不同的值。然后,通过设置该标签的值来配置比例。如果您希望按 20/80 的比例分配,可以为 Spot 节点池设置值 [“2”、“3”、“4”、“5”],而为按需节点池设置值 [“1”]。

在中断(合并)过程中保护批处理任务

此功能是为了保护长时间运行的批处理作业,防止它们在 Karpenter 管理的节点合并过程中被中断。合并(Consolidation)是 Karpenter 识别低利用率节点并将其移除或替换,以降低集群成本的过程。然而,这一过程可能会中断正在运行的 Pod,包括关键的批处理任务。

通过使用 karpenter.sh/do-not-disrupt: “true” 注解,您可以保护这些 Pod 免受迁移或中断,直到它们的任务完成,确保它们顺利执行并完成。

或者,您也可以配置 disruption 字段,将 consolidationPolicyconsolidateAfter 结合使用。

通过设置 disruption,您可以告诉 Karpenter 哪些类型的节点需要考虑合并。您还可以通过设置字符串值“Never”完全禁用合并。

高级最佳实践

使用 Drift 更新节点

Karpenter 的 “drift” 机制会在节点的配置与 NodePool 或 nodeClassRef 中的期望状态不匹配时,将节点标记为“Drift”。漂移可能由多种原因引起,例如 NodePool 配置的变化或基础设施更新(如 AMI 版本变更)。通过使用 Karpenter 的漂移功能,用户可以高效地管理工作节点的升级,确保它们与最新的控制平面版本和基础设施保持一致。

通过自定义用户数据自动化配置节点

通过在 EC2NodeClass 中使用 userData 字段,用户可以在启动工作节点时自动执行额外的配置,而无需偏离标准的 AWS EKS 优化 AMI。这些配置任务包括修改 Kubernetes 设置、挂载卷或运行特定的启动脚本等。

提前超配容量以提高响应速度

这种策略旨在通过预先超配额外的计算资源,确保在需要时能够立即获得计算能力。这对于那些您预知将需要同时启动大量 Pod 的场景尤为有效,比如处理数据流水线。通过提前超配容量,您可以显著减少工作负载启动所需的时间,从而提高整体响应速度和性能。

对于关键生产环境,合理的超配比例可能在 10-20% 之间。

CloudPilot AI 助您轻松使用 Karpenter

CloudPilot AI 基于 Karpenter 构建,在 Karpenter 现有特性的基础之上优化用户的使用体验,包括:

1、简化安装部署流程

对于普通用户来说,安装部署 Karpenter 需要 1~2 周 的时间,并且需要工程师手动运维。而 CloudPilot AI 仅需5分钟 即可完成安装部署,而且全托管服务,无需运维。

此外,当 Karpenter 推出新版本时,CloudPilot AI 可以帮助用户自动、丝滑升级。升级时间可从数天缩短至几小时。

2、Spot 实例智能运维:提前120分钟预测中断、自动回退

使用 Karpenter 的大部分用户都会用到 Spot 实例来降低云成本。但 Spot 实例的中断事件常让工程师措手不及。Karpenter 本身不具备预测中断的能力,只有接到中断通知后才开始处理节点。对于大规模集群而言,风险极大。

CloudPilot AI 通过机器学习算法可以预测超过7500个实例的中断事件,并且提前 120 分钟通知用户。并且还能将相应的应用自动迁移到中断率更低、更稳定的实例上。保障服务稳定性,同时解放运维团队的时间。

3、更智能的节点选型

Karpenter 仅能根据价格因素选择节点,因此有可能选出价格差异不大,但性能差异巨大的节点,最终导致成本只有微小的下降,但性能却发生巨大的损耗。

CloudPilot AI 在此基础上对节点选择功能进行智能化升级。在选取实例的过程中,除了价格因素外,还将网络带宽、磁盘 I/O、芯片类型等因素纳入考虑范围内,通过智能算法选出兼顾成本和性能的实例类型,以减少资源浪费,增强应用稳定性。


推荐阅读

告别云成本烦恼!Spot Insights 上线啦

服务600+客户的3D生成AIGC公司如何实现GPU成本降低70%?

基于KEDA和Karpenter的K8s弹性伸缩实践方案

标签:负载,伸缩,15,中断,实例,Karpenter,Pod,节点
From: https://www.cnblogs.com/cloudpilot-ai/p/18634993/best-practice-karpenter

相关文章

  • P1552 [APIO2012] 派遣
    P1552[APIO2012]派遣题目背景在一个忍者的帮派里,一些忍者们被选中派遣给顾客,然后依据自己的工作获取报偿。题目描述在这个帮派里,有一名忍者被称之为Master。除了Master以外,每名忍者都有且仅有一个上级。为保密,同时增强忍者们的领导力,所有与他们工作相关的指令总是由上级......
  • CF1534G A New Beginning 题解
    题目传送门前置知识曼哈顿距离与切比雪夫距离的相互转化解法将切比雪夫距离转换成曼哈顿距离,有新坐标为\((\frac{x_{i}+y_{i}}{2},\frac{x_{i}-y_{i}}{2})\),因带一个\(\frac{1}{2}\)的常数不妨提出来得到\((x_{i}'=x_{i}+y_{i},y_{i}'=x_{i}-y_{i})\)最后统一乘起来。此......
  • 【深基15.习9】验证栈序列
    题目描述给出两个序列pushed和poped两个序列,其取值从1到\(n(n\le100000)\)。已知入栈序列是pushed,如果出栈序列有可能是poped,则输出Yes,否则输出No。为了防止骗分,每个测试点有多组数据,不超过\(5\)组。输入格式第一行一个整数\(q\),询问次数。接下来\(q\)个询问,......
  • 9.15
    7. HBase基本操作概述HBase是一个分布式、面向列的NoSQL数据库,适用于存储非结构化或半结构化数据。本文将介绍如何使用HBaseShell进行基本操作。内容HBase数据模型使用HBaseShell进行增删改查操作HBase表设计注意事项代码示例#创建表create 'mytable',......
  • VMware15如何安装?附安装包和序列号
    前言大家好,我是小徐啊。VMware是我们在Java开发中,常用的一款工具,可以让我们开启虚拟机,这样就可以有linux的环境了。但是VMware一般是需要序列号的,今天小徐就来介绍下如何安装VMware,以及提供序列号。文末附获取方式。如何安装VMware首先,双击下安装包,开始安装。点击下一步按钮。......
  • 小程序可测性能力建设与实践15
     1.引言测试活动从本质上可以视为被测系统因为某个激励产生相应的响应,并对这些响应进行全面检测的过程。这个过程(激励->响应->检查)涉及到两个角色:测试者以及测试对象,测试者执行激励与检查响应,由机器(程序)或者人来完成;被测对象接受激励,产生响应。从这个过程来看:激励可控,响应......
  • PTA 正整数A+B(15分)
    正整数A+B题的目标很简单,就是求两个正整数A和B的和,其中A和B都在区间[1,1000]。稍微有点麻烦的是,输入并不保证是两个正整数。输入格式:输入在一行给出A和B,其间以空格分开。问题是A和B不一定是满足要求的正整数,有时候可能是超出范围的数字、负数、带小数点的实数、甚至是一堆乱......
  • 15-makefile
    一、Makefile的概述1.认识makemake是一个命令,是个可执行程序,用来解析Makefile文件的命令;linux环境下,这个命令存放在/usr/bin/目录下;当用户输入make指令时,系统会自动寻找makefile、Makefile、GNUmakefile中任何一个,根据该文件中的指令编译工程。2.什么是makefil......
  • 《痞子衡嵌入式半月刊》 第 115 期
    痞子衡嵌入式半月刊:第115期这里分享嵌入式领域有用有趣的项目/工具以及一些热点新闻,农历年分二十四节气,希望在每个交节之日准时发布一期。本期刊是开源项目(GitHub:JayHeng/pzh-mcu-bi-weekly),欢迎提交issue,投稿或推荐你知道的嵌入式那些事儿。上期回顾:《痞子衡嵌入式半月......
  • # [THUSC2015] 异或运算
    P5795[THUSC2015]异或运算题目描述给定长度为\(n\)的数列\(X={x_1,x_2,...,x_n}\)和长度为\(m\)的数列\(Y={y_1,y_2,...,y_m}\),令矩阵\(A\)中第\(i\)行第\(j\)列的值\(A_{i,j}=x_i\\operatorname{xor}\y_j\),每次询问给定矩形区域\(i∈[u,d],j∈[l,r]\),找出第......