首页 > 其他分享 >龙蜥白皮书精选:云原生混部资源隔离技术

龙蜥白皮书精选:云原生混部资源隔离技术

时间:2023-08-23 11:35:27浏览次数:39  
标签:原生 场景 隔离 技术 白皮书 混部 资源

文/云原生 SIG

01 技术方案简介

混部就是将不同类型的业务在同一台机器上混合部署起来,让它们共享机器上的 CPU、内存、IO 等资源,目的就是最大限度地提高资源利用率,从而降低采购和运营等成本。

混部通常是将不同优先级的任务混合在一起,例如高优先的实时任务(对时延敏感,资源消耗低;称为在线)和低优先级批处理任务(对时延不敏感,资源消耗高;称为离线),当高优先级业务需要资源时,低优先级任务需要立即归还,并且低优先级任务的运行不能对高优先级任务造成明显干扰。

为了满足混部的需求,在单机维度的内核资源隔离技术是最为关键的一项技术,龙蜥云内核在资源隔离的技术上深耕多年,并且在行业中处于领先地位,这些内核资源隔离技术主要涉及内核中的调度、内存和 IO 这三大子系统,并且在各个子系统领域根据云原生的混部场景进行了深入的改造和优化,关键优化包括但不限于:cpu group identity 技术、SMT expeller 技术、基于 cgroup 的内存异步回收技术等。其中 cpu group identity 已经申请对应的专利,有独立的知识产权。这些关键的技术使客户有能力在云原生混部场景中根据业务特点给出最优解决方案,可有效提高用户的资源使用率并最终降低用户资源的使用成本,非常适用于容器云混部场景,同时也是大规模化混合部署方案所强依赖的关键技术。

龙蜥白皮书精选:云原生混部资源隔离技术_云原生

02 规模化部署和收益

目前龙蜥 OS 的资源隔离技术已经在手机制造企业、互联网企业、大型国企,以及阿里云、蚂蚁集团内部规模化应用。从以往众多用户的部署经验来看,在保障客户的 QoS 的前提下 CPU 的使用率可以达到 30%~50%,比如龙蜥和 Koordinator 开源混部技术带来的红利,帮助阿里巴巴实现规模超千万核的云原生混部,混部 CPU 利用率超 50%,帮助 2021 年“双 11”计算成本下降 50%,为客户降本增效提供了良好的技术保障和售后服务。

03 技术竞争力

目前国内完全开源的且带有云原生场景隔离能力的社区只有龙蜥,在内核隔离能力这块龙蜥社区根据云场景做了丰富的定制化开发,是国内最早的一批使用隔离能力的企业,并在阿里云中有广泛的使用,技术的成熟度和稳定性有较高的保障,龙蜥在资源隔离不管从源码透明度,还是从技术的深度,以及场景的广度都是用户第一选择。如有进一步了解的需求,可钉钉搜索群号:44701621,加入云原生 SIG 群交流。

更多龙蜥白皮书精选内容:

【1】面向 DPU 场景的软硬协同协议栈

【2】敏捷开发场景下的调度器热升级 SDK

【3】跨云-边-端的只读文件系统 EROFS

【4】龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

【5】面向异构计算的加速器 SDK

【6】基于 SM4 算法的文件加密(fscrypt)实践

【7】CentOS 迁移场景的平滑迁移方案

【8】利用 io_uring 提升数据库系统性能

【9】开源 RISC-V 技术支持软硬件全栈平台

【10】Ancert——硬件兼容性验证与守护


相关链接:

云原生 SIG 主页:https://openanolis.cn/sig/cloud-native

更多龙蜥技术特性解析可移步《龙蜥特性百科》:https://anolis.gitee.io/anolis_features/

2022 龙蜥社区全景白皮书(或关注公众号【OpenAnolis龙蜥】回复关键字“白皮书”获取)https://openanolis.cn/openanoliswhitepaper


—— 完 ——

标签:原生,场景,隔离,技术,白皮书,混部,资源
From: https://blog.51cto.com/u_15308345/7200369

相关文章

  • 云原生批量计算引擎 Volcano社区v1.8.0版本正式发布
    本文分享自华为云社区《云原生批量计算引擎Volcano社区v1.8.0版本正式发布》,作者:云容器大未来。北京时间2023年8月17日,Volcano社区v1.8.0版本正式发布,此次版本增加了以下新特性:支持vGPU调度及隔离支持vGPU和用户自定义资源的抢占能力新增JobFlow工作流编排引擎......
  • 原生JS 根据需求生成表格
    <!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>Document</title><style>td{padding:10px;border-collapse:collapse;}</styl......
  • 云原生第十周——promethus简介(上)
    监控简介:监控的价值:长期趋势分析:通过对监控样本数据的持续收集和统计,对监控指标进行长期趋势分析。例如,通过对磁盘空间增长率的判断,我们可以提前预测在未来什么时间节点上需要对资源进行扩容。对照分析:两个版本的系统运行资源使用情况的差异如何?在不同容量情况下系统的并发和......
  • Flutter 如何与原生平台通信
    Flutter是开发跨平台应用程序的完美工具。使用Flutter,您可以轻松制作出性能卓越、美观大方的应用程序。但为了访问原生平台API,您需要与原生平台进行通信。Flutter只能理解Dart语言,原生平台只能理解它们各自的编程语言。那么,Flutter和原生平台是如何相互通信的呢?是二进制Flu......
  • HTML5原生拖拽/拖放 Drag & Drop 详解
    前言拖放(drap&drop)在我们平时的工作中,经常遇到。它表示:抓取对象以后拖放到另一个位置。目前,它是HTML5标准的一部分。我从几个方面学习并实践这个功能。拖放的流程对应的事件我们先看下拖放的流程:选中--->拖动--->释放然后,我们一步步看下这个过程中,会发生的事情。选......
  • 二、原生 API 的注解使用示例
    [email protected](METHOD)@Retention(RUNTIME)public@interfaceRequestLine{//请求方式+uriStringvalue();//斜线是否base64编码booleandecodeSlash()defaulttrue;//默认支持URL传多值,是通过key来传输的。形如:key=value1&......
  • 云原生之使用Docker部署开源Leanote蚂蚁笔记
    (云原生之使用Docker部署开源Leanote蚂蚁笔记)一、Leanote蚂蚁笔记介绍1.Leanote简介Leanote蚂蚁笔记是一款云笔记工具,蚂蚁笔记(又名LeaNote)就是一款国产开源的私有云笔记软件。它支持普通格式笔记、Markdown语法、专业数学公式编辑、和思维脑图,常见的笔记相关功能它都拥有,同时......
  • 关于云原生开源开发者沙龙「微服务X消息队列专场」的延期通知
    作者:微服务X消息队列各位报名参会的同学,大家好:非常感谢大家对本期云原生开源开发者沙龙「微服务X消息队列专场」的关注与支持。因故原定于8月12日(周六)举办的沙龙延期举行。具体时间和举办地点如下:阿里云云原生开源开发者沙龙微服务X消息队列专场深圳站,推迟于8月27日(......
  • RocketMQ 5.0 架构解析:如何基于云原生架构支撑多元化场景
    作者:隆基本文将从技术角度了解RocketMQ的云原生架构,了解RocketMQ如何基于一套统一的架构支撑多元化的场景。文章主要包含三部分内容。首先介绍RocketMQ5.0的核心概念和架构概览;然后从集群角度出发,从宏观视角学习RocketMQ的管控链路、数据链路、客户端和服务端如何交互;最后......
  • 阿里云产品测评赢大奖丨云原生网关 MSE-Higress
    产品介绍云原生网关MSE-Higress(以下简称MSE-Higress)是遵循开源Ingress/GatewayAPI标准的下一代网关产品,将传统的流量网关、微服务网关、安全网关合三为一,降低50%的资源开销,具有高集成、易使用、易扩展、热更新的特点。MSE-Higress提供了流量调度、服务治理、安全防护......