首页 > 其他分享 >新一代云原生可观测平台之CCE服务监控篇

新一代云原生可观测平台之CCE服务监控篇

时间:2023-11-02 16:34:17浏览次数:31  
标签:原生 运维 新一代 集群 监控 CCE 资源

本文分享自华为云社区《新一代云原生可观测平台之CCE服务监控篇》,作者: 云容器大未来。

在云原生容器化浪潮的当下,监控是确保业务稳定性最受关注的问题之一。那么,华为云CCE容器服务又是如何帮助用户提高运维效率呢?

半年来,CCE容器服务的运维团队持续拜访用户,并总结用户在云原生运维场景下的痛点问题,主要有以下三大痛点问题:

  • 搭建云原生集群监控系统涉及的配置项多,包括集群自身的组件、资源的监控、业务组件的监控等,技术门槛较高。
  • 云原生场景下的监控指标涵盖五大类,近数十万项,同时不同类型指标之间相互关联,传统监控难以将这些信息可视化。
  • Promtheus已成为业界云原生监控的事实标准。但开源方案在商用场景下仍存在一些非功能性问题,尤其是海量监控指标带来的高资源消耗,导致成本显著增加。

image.png图1 云原生运维的痛点问题

基于上述几个痛点,CCE联合AOM服务团队从开箱即用:一键启用容器监控能力全景观测:多维度全场景监控视图开源增强:兼容开源Promtheus,全方位能力提升等维度共同打造新一代云原生监控平台,为用户提供更加方便快捷的运维手段。

开箱即用:一键启用容器监控能力

为了方便用户快速触达监控中心,我们对开启监控中心的步骤进行了极致的简化,并将AOM服务上的监控信息整合到CCE的监控中心。现在,只需前往监控中心一键开启,即可在集群监控中心中查看容器基础资源、Kubernetes资源对象和Kubernetes服务组件的监控指标。

image.png图2 创建集群时开通监控中心

image.png

图3 监控中心一键开通

全景观测:多维度全场景监控视图

CCE监控中心提供集群内涵盖基础资源、K8s资源对象、K8s服务组件、K8s集群Node、云原生上层业务等五大类,总计近数十万项指标的全景可观测能力,致力打造一站式运维的极致体验。

集群健康总览:监控中心首页会呈现整个集群中关键的控制面组件信息、资源占用最高的组件等,能让您对集群的健康情况一目了然。

image.png图4 集群健康总览

资源健康总览:监控中心提供了节点、工作负载、POD等Kubernetes资源的独立监控页面。资源监控页面中提供资源的基本监控信息,并且能够纵览对应的资源概况,快速发现异常对象。

image.png图5 资源健康总览

关联资源一屏可见:在监控中心中,在资源监控详情页中能看到关联资源的监控详情,并且可以方便的进行跳转查看(如在看节点监控时可以下钻至节点上的Pod,查看Pod的监控)。

image.png图6 资源监控详情页

监控大盘:监控中心中提供了丰富的监控大盘,从集群、Node、控制组件等不同的视角呈现集群的健康状态。

image.png图7 监控中心仪表盘

开源增强:兼容开源Promtheus,全方位能力提升

Prometheus是CNCF社区推荐的云原生监控方案,也是业界云原生监控的事实标准,它的服务发现、时序数据等能力能够很好地解决云原生场景下多变、海量数据的问题。同时,Prometheus也是用户使用最多的监控工具。

为了更好地符合用户的使用习惯,降低学习成本,CCE提供基于Prometheus开源生态能力的监控组件,兼容Prometheus的开源配置,同时在开源能力基础上对安全、性能、安装部署等方面做了商用增强。

在安全上,使用防护能力更强的华为自研的加密算法,对Prometheus使用的敏感信息进行加密;在性能上,一方面对监控指标进行分层管理,满足不同类型用户的监控诉求,另一方面,降低本地存储数据的时效,有效地降低了用户的资源消耗;在安装部署上,需要用户配置的参数由30+优化至0配置一键安装。

除此之外,针对Prometheus在海量数据下资源消耗巨大的问题,我们还提供了托管Prometheus+轻量化采集Agent的解决方案,用户侧仅需要负担轻量化采集Agent的资源即可支持海量指标监控,同时大大降低了用户的运维复杂度。

对比维度

开源Prometheus

CCE监控套件

安全性

认证信息使用base64加密,安全防护弱

认证信息使用华为云自研算法加密,安全防护强

资源消耗

200节点消耗256G内存

200节点消耗8G内存

安装部署

需要准备30+的yaml部署文件

页面一键安装,无需配置

指标管理

指标管理需要后台找到对应的采集任务(CRD)进行配置

监控指标支持通过界面分层管理,基础指标默认启用,高级指标灵活配置(即将上线)

我们非常期待本期带来的监控中心能力能够有效地提升您的运维体验,同时我们也会对监控中心进行持续的优化。期待您的使用以及宝贵的改进意见。

后续我们还会有其他运维特性的介绍,如告警中心,健康诊断、日志中心等,敬请期待。

服务体验请访问

相关链接

点击关注,第一时间了解华为云新鲜技术~

标签:原生,运维,新一代,集群,监控,CCE,资源
From: https://www.cnblogs.com/huaweiyun/p/17805705.html

相关文章

  • xxl-job默认accessToken命令执行漏洞复现
    起因:昨天看见微步发布XXL-JOB默认accessToken身份绕过漏洞,之前hw期间遇到过几次,都没弱口令和未授权,对其有点印象,遂复现一下。漏洞影响:2.3.1和2.4 环境准备:1、下载即可:https://github.com/xuxueli/xxl-job/releases/tag/2.4.0将其导入IDEA中,即可进行分析。环境要求:Maven......
  • Success Rate
    https://www.luogu.com.cn/problem/CF773A以后看到求最值都可以尝试二分。然后发现如果只是要求数值相等,是一定有解的,但是题目要求分子加上的不超过分母加上的,发现这个是有单调性的,因为\(k\)变大,分子分母变大的时候分子肯定还是小于等于分母的(简单推导即可)。很烦的是这个东西的......
  • 云原生架构实战05 KubeSphere 实战
    一、多租户系统实战添加一个hr用户创建企业空间......
  • HarmonyOS鸿蒙原生应用开发设计- 元服务(原子化服务)图标
    HarmonyOS设计文档中,为大家提供了独特的元服务图标,开发者可以根据需要直接引用。开发者直接使用官方提供的元服务图标内容,既可以符合HarmonyOS原生应用的开发上架运营规范,又可以防止使用别人的元服务图标侵权意外情况等,减少自主创作元服务图标的工作量。当然,如果有个性化的自主又有......
  • 基于eBPF是云原生可观测实践
    eBPF技术是Linux内核3.15版本中引入的全新设计,自从2014年发布以来,一直都备受瞩目。在过去几年中,基于eBPF技术的实践和工程落地层出不穷,出现了爆发式的增长。2015年微软、Google、Facebook、Netflix和Isovalent也共同宣布在Linux基金会下成立了一个新的eBPF基金会,以帮助支持......
  • 详细讲解原生js拖拽
    场景描述今天遇见一个问题,那就是产品希望在弹出来的窗口。可以移动这个弹窗的位置增加用户体验,我们直接使用的element-ui中的Dialog对话框我们现在需要拖拽标题,移动元素位置元素拖拽的思路要让元素按下移动,我们需要实现以下几个步骤:1.鼠标按下元素跟随光标移动2.鼠标抬起元......
  • 用友签约索通发展,共建冶金行业新一代数智化智能工厂
    10月30日,用友网络科技股份有限公司(以下简称“用友”)与索通发展股份有限公司(以下简称“索通发展”)就新一代数智化智能工厂项目正式签约。索通发展总裁郝俊文、副总裁郎静、董事长特别助理桑溪月,用友网络大型企业客户事业群总裁何强、副总裁兼高端BG实施中心总经理李建敏、钢铁冶金行......
  • 使用原生js 写的picker 效果
    classPicker{ DEFAULT_DURATION=200; MIN_DISTANCE=10; DEMO_DATA=[]; //demo数据 //惯性滑动思路: //在手指离开屏幕时,如果和上一次move时的间隔小于`MOMENTUM_LIMIT_TIME`且move //距离大于`MOMENTUM_LIMIT_DISTANCE`时,执行惯性滑动......
  • access 进度条
    请在[布局视图]下设置,效果如下 OptionCompareDatabaseDimsAsIntegerPrivateSubForm_Load()'初始化变量Me.TimerInterval=10Command4.Width=0EndSubPrivateSubForm_Timer()Ifs<100Thens=s+1'自增量,可以设置自己的自......
  • APP开发选原生开发还是混合开发?
    最近也有不少用户留言,问一些基础的内容,例如:App采用怎样的开发方式更好?便有感而发,希望通过这篇文章再做一下小结。先亮结果,是采用原生还是混合的开发方式,需要先了解业务规划,然后根据业务的实际需求再制定研发技术选型及研发计划。为什么只能一事一议?这个还得从技术架构的优劣势开始......