首页 > 其他分享 >秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?

秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?

时间:2024-01-23 19:32:57浏览次数:30  
标签:可用 调度 ECI nginx 秒级 弹性 Pod 算力

作者:吴昆

前言

在前面的文章《弹性调度助力企业灵活应对业务变化,高效管理云上资源》中,我们介绍了阿里云容器服务 ACK 弹性调度为了帮助客户解决在使用云上弹性资源时,面对的“难以差异化控制业务资源使用量,缩容时部分业务 Pod 未释放”等挑战,提供了按照多级资源的优先顺序进行调度,以及按照定义的优先顺序进行缩容的能力。

本文将介绍弹性调度如何使用虚拟节点来满足您的业务弹性需求。

企业在实施应用弹性过程中,弹性速度弹性位置是重点关注的两个核心指标。

对于追求高可用以及稳定性的企业来说,敏捷的弹性能够在业务流量突增时,保证系统的连续性与稳定性。同时,通过跨多地域部署应用,可以在地域性故障发生时,有效地维持服务的持续可用性。

对于大数据处理任务的企业来说,快速的弹性能够缩短任务执行时间,加快应用的迭代速度。同时,集中部署在单个地域,则可以减少应用之间的网络通信时延,从而进一步提升数据处理效率。

显然,这两个指标对于确保企业业务的稳定高效运行至关重要。

然而,许多企业在面对快速到来的业务流量高峰和日益增长的大数据算力需求时,现行的分钟级自动伸缩节点池的弹性响应已经无法满足需求。并且,通过合理的部署策略,实现预期的弹性位置,也颇具挑战。

为此,阿里云推出弹性容器实例(Elastic Container Instance,ECI),以十秒级的弹性速度,有效应对突发流量的弹性需求。同时,阿里云容器服务 Kubernetes 版(ACK)利用虚拟节点技术实现与 ECI 弹性资源的无缝集成,使得业务能够在集群内灵活动态地调用 ECI 资源,迅速应对弹性挑战。此外,容器服务 ACK 的弹性调度功能在将业务调度到 ECI 上时,还能维持业务的亲和性配置不变,确保应用运行的稳定和高效。

使用虚拟节点实现秒级弹性

为了在 ACK 中使用 ECI,需要在 ACK 集群中安装虚拟节点组件。

在 ACK Pro 版集群中,可以通过组件管理页面部署 ack-virtual-node 组件,该组件默认被托管,不占用 Worker 节点资源。

在 ACK 专有版集群中,可以通过应用市场页面部署 ack-virtual-node 组件,安装成功后会在 kube-system 命名空间下创建一个名为 ack-virtual-node-controller 的 deployment,该 deployment 会运行在您的 Worker 节点上。

安装成功后用户可以通过 kubectl get no 命令在集群中查看到若干虚拟节点,代表虚拟节点安装成功。

虚拟节点安装成功之后,可以使用弹性调度功能配置 ECI 的使用策略,以下是“优先调度 ECS,当 ECS 资源使用完后使用 ECI 资源”的示例。

apiVersion: scheduling.alibabacloud.com/v1alpha1
kind: ResourcePolicy
metadata:
  name: test
spec:
  strategy: prefer
  units:
  - resource: ecs
  - resource: eci

配置了以上 ResourcePolicy 之后,在 default 命名空间下的所有 Pod 都将遵循以下的调度规则:优先使用 ECS,ECS 资源用完后使用 ECI。

标签:可用,调度,ECI,nginx,秒级,弹性,Pod,算力
From: https://blog.51cto.com/u_13778063/9382405

相关文章

  • 秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?
    作者:吴昆前言在前面的文章《弹性调度助力企业灵活应对业务变化,高效管理云上资源》中,我们介绍了阿里云容器服务ACK弹性调度为了帮助客户解决在使用云上弹性资源时,面对的“难以差异化控制业务资源使用量,缩容时部分业务Pod未释放”等挑战,提供了按照多级资源的优先顺序进行调度,......
  • AI驱动下的算力浪潮,中国稳居全球第二
    AI大模型的发展引发了对算力的进一步需求。中国信通院发布的《中国综合算力指数(2023年)》显示,当前算力规模中,通用算力占比达74%,智能算力规模同比增加60%至25%。大模型对人工智能算力的重要推动作用。如今,算力已深入渗透到科研、工业生产乃至日常生活的各个角落,成为与水电同等重要的......
  • OpenAI CEO奥特曼:未来最重要的资源是算力和能源
    在近期举办的2024世界经济论坛上,人工智能无疑成为了一个焦点议题,特别是向通用人工智能(AGI)发展的过程,是否会加剧气候问题?AI技术的发展不仅需要巨量的计算资源,还伴随着极高的能源消耗。OpenAICEO奥特曼接受采访中表示,为了实现AI技术的飞跃发展,我们需要比以往更多的能源。而未来最重......
  • 阿里云 ACK 云原生 AI 套件中的分布式弹性训练实践
    作者:霍智鑫众所周知,随着时间的推移,算力成为了AI行业演进一个不可或缺的因素。在数据量日益庞大、模型体量不断增加的今天,企业对分布式算力和模型训练效率的需求成为了首要的任务。如何更好的、更高效率的以及更具性价比的利用算力,使用更低的成本来训练不断的迭代AI模型,变成了迫......
  • AlphaGeometry:DeepMind 大算力再造奇迹,但「算力代替智力」或许并非最优解
    作者:李宝珠编辑:三羊封面图来源:GoogleDeepMindDeepMind用算力堆出奇迹?被夸上天的AlphaGeometry含金量有多高近日,谷歌DeepMind的Alpha系列再添新成员——AlphaGeometry,依旧声势浩大,「里程碑」、「史诗级」、「逼近人类」等赞美之词溢出屏幕。那么,这个号称奥数能力金牌级......
  • 阿里云云原生弹性方案:用弹性解决集群资源利用率难题
    作者:赫曦随着上云的认知更加普遍,我们发现除了以往占大部分的互联网类型的客户,一些传统的企业,一些制造类的和工业型企业客户也都开始使用云原生的方式去做IT架构的转型,提高集群资源使用率也成为企业上云的一致共识。大家上云的同时,开始思考有没有云原生的方法能**更好地实现提高......
  • 极智一周 | 谈谈AI发展、训练算力、推理算力、AI编译框架、Copilot键 And so on
    欢迎关注我的公众号[极智视界],获取我的更多技术分享大家好,我是极智视界,带来本周的[极智一周],关键词:谈谈AI发展、训练算力、推理算力、AI编译框架、Copilot键Andsoon。极智视界本周热点文章回顾(1)谈谈AI发展系列本周带来三篇"谈谈AI发展"分享,包括AI训练算力、AI推理......
  • 商业应用算力全球新标杆!浪潮信息八路服务器创SAP SD评测最高性能
    1月15日,据全球领先的企业应用软件提供商SAP发布的最新SAPSD评测结果,浪潮信息TS860G7服务器创下1,659,970 SAPS的最高性能成绩,成为商业应用算力的全球新标杆。TS860G7是浪潮信息最新一代的企业级八路服务器,其取得的最新成绩也成功超越了16路小型机系统保持的性能纪录。SAPSD是SAP......
  • Controller(Deployment)-升级回滚和弹性伸缩
    在部署过程中,升级回滚和弹性伸缩是两个重要的功能,可以帮助我们管理和优化系统的性能和可靠性。升级回滚是指在部署过程中,如果有新的版本需要发布,我们可以使用升级功能将新版本部署到系统中。升级过程中,我们可以选择同时运行新旧版本,逐步切换到新版本,或者直接替换旧版本。如果在升......
  • 空间计算时代催生新一波巨大算力市场需求
    什么是空间计算?空间计算是一种整合虚拟现实(VR)、增强现实(AR)、混合现实(MR)等技术的计算模式,旨在将数字信息与真实世界融合在一起。这种融合创造了一个全新的计算环境,能够感知和理解我们周围的空间,并将数字内容与现实场景相互交织。空间计算的应用范围非常广泛,例如地理信息系统(GIS)、智......