首页 > 其他分享 >织密“安全云网”,天翼云探索构建分布式多场景云服务稳定性保障体系!

织密“安全云网”,天翼云探索构建分布式多场景云服务稳定性保障体系!

时间:2023-04-27 11:35:08浏览次数:28  
标签:云网 服务 故障 天翼云 稳定性 织密 构建 分布式


近日,中国信息通信研究院(以下简称“中国信通院”)主办,混沌工程实验室承办的信息通信领域系统稳定性保障沙龙·北京站成功举办。沙龙以“共筑数字免疫韧性长城,助力信息通信行业稳定安全运行”为主题,旨在促进信息通信领域系统稳定性保障技术交流,推动信息通信领域稳定安全运行水平提升,加强“稳保”领域的先进技术和人才合作。会上,天翼云科技有限公司高级运维专家尹磊以《天翼云分布式多场景云服务稳定性探索实践》为题发表演讲。

织密“安全云网”,天翼云探索构建分布式多场景云服务稳定性保障体系!_云服务

在应用全面上云的大背景下,云计算已经成为现代通讯系统的核心基础设施之一,其稳定性对于通信业务的正常运转至关重要。云服务作为部署在大规模硬件系统上的分布式软件系统,面向租户提供一系列的共享服务,其运行环境十分复杂。由于底层硬件存在一定的不稳定因素,如何在不稳定的环境中为用户提供稳定的服务,是云服务提供商所面临的一项重要挑战。

织密“安全云网”,天翼云探索构建分布式多场景云服务稳定性保障体系!_恢复能力_02

作为云服务国家队,天翼云探索出一套有效的稳定性保障体系并积极实践落地。围绕少出故障、不出重大事件、故障快速恢复、用户对故障无感知的目标,天翼云进行了分布式多场景云服务稳定性能力建设探索,率先以稳定性指标体系为牵引,以演练为有效验证手段,在可观可测、故障快速恢复、变更可信三大方面优先建设,构建了天翼云分布式多场景云服务稳定性保障能力的基础。


具体而言,天翼云为实现故障快速发现与精准定位,构建了“监”“测”“控”“观”“量”五位一体的立体化全链路可观测能力;在打造高效的故障处理与快速恢复能力方面,天翼云构建以SLO为目标的、基于正向的故障快速恢复能力;此外,变更风险是影响云服务稳定性的重大因素之一,针对可信变更,天翼云建立变更风险评估模型和规则,使变更风险的评估从依据个人经验变为依靠变更系统的功能。

高可用、高可靠、稳定安全的云服务能力建设,需要现网的效果反馈和不断迭代升级。天翼云构建了事前、事中、事后一体化的稳定性保障能力评价体系,推进稳保能力的正向建设与负向改进。同时,天翼云建设故障自动化注入的演练平台,通过演练场景、能力验证、效果复盘等步骤,来验证稳定性保障能力水平。

近年来,数字技术日新月异,信息化系统的重要性日益突显,系统稳定性成为企业顺利开展业务、实现可持续与高质量发展的关键。一直以来,天翼云为客户提供安全可信的产品和服务,并在稳定性保障体系建设方面走在行业前列,未来天翼云也将继续深耕云技术,通过提供更加稳定可靠的云服务,帮助企业构建起数字免疫韧性长城,护航企业行稳致远。


标签:云网,服务,故障,天翼云,稳定性,织密,构建,分布式
From: https://blog.51cto.com/u_15444077/6230105

相关文章

  • 河北电信“天翼云开放实验室”在雄安揭牌,加速算力资源落地!
    近日,“2023年河北电信天翼云生态合作论坛”在雄安新区成功举办。作为“2023年河北电信数字科技生态大会”的分论坛之一,此次论坛汇集了众多合作伙伴,共同分享了中国电信在云改数转过程中的核心技术与数字化能力成果。论坛上,河北电信“天翼云开放实验室”成功揭牌,标志着天翼云技术融合......
  • 混合云网络打通
    概述多云管理集群分为两类,主集群和子集群。各个集群需要打通实现一个集群的pod能够访问到另一个集群的pod。这样才能实现应用的跨云部署。主机群一般会提供一些公共服务,子集群的pod一般会去使用,这样就需要实现主子集群的网络互通。实现方式就是端口固定,通过LB暴露,然后绑定域名,通......
  • 删除百度云网盘和夸克网盘的右键菜单
    由于这些网盘在启动时会检测注册表,右键菜单被删了还会重新添加回来,如果你平时不用这些软件,直接卸载最好,然后可以在浏览器安装脚本网盘直链下载助手,直接通过浏览器下载。将以下内容保存进新建的del.reg文件中,然后双击运行即可,每次被重新添加的化就执行一下。WindowsRegistr......
  • 数字先锋 | 乘“云”之势,天翼云助力长春市妇产医院步入智慧医疗新时代!
     近年来,大数据、云计算、5G等新兴技术逐步融入卫生健康服务各个领域,驱动传统医疗卫生服务向数字健康发展阶段迈进。各地医疗机构积极响应国家号召,推进医院信息化建设提档升级,加快信息系统云上部署,我国医疗行业正逐步迈向数字化转型新阶段。长春市妇产医院始建于1896年,是一所集......
  • 玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!
     数字时代下,算力成为新的核心生产力,传统以CPU为核心的架构难以满足新场景下快速增长的算力需求,具备软硬加速能力的DPU得以出现并快速发展。天翼云凭借领先的技术和丰富的应用实践自研紫金DPU,打造为云而生的全新一代云计算体系结构,助力算力基础设施升级,赋能海量算力高效释放。传......
  • 玩转云端 | 真实模拟,即压即测,天翼云息壤性能测试PTS实践大揭秘!
     满城春色惹人醉,恰是出游好时节。伴随春暖花开,我国旅游市场快速升温,越来越多的人开始走出家门,去追寻久违的诗和远方。根据文化和旅游部数据中心近日测算,预计2023年,我国国内旅游人数约为45.5亿人次,同比增长约80%。全国旅游市场呈现出“稳开高走,持续回暖”的态势。 为了吸引更......
  • Docker 快速入门(腾讯云网页版)
    实验简介本实验将演示如何在Centos中为Docker配置镜像加速,如何拉取和查看Docker镜像,如何创建、查看和启动容器与删除容器和镜像等Docker基本操作。实验网址:https://cloud.tencent.com/lab/courseDetail/768138035069433实验资源云服务器CVM、CentOS7.864位。......
  • 华为云网站安全方案为企业数据保驾护航
    随着云计算技术的快速发展,更多企业选择将业务迁移上云,而保障网站业务安全,成为诸多企业重点关注的问题。根据Gartner调查报告显示,信息安全中超过75%都发生在Web应用层上,可能造成的危害结果包括数据信息泄露、数据被篡改、网站被篡改、域名被劫持、大流量DDoS、黑客导致网站无......
  • 华为云网站安全解决方案,助力企业安心稳步发展
    随着信息化新时代的来临,网络成为了人民社会生活中不可缺少的重要组成部分。小到吃饭、购物,大到水电缴纳、日常就医,网络已经深入到我们生活的方方面面,因此,它的安全也就显得尤为重要。 据统计,有超过75%的网络安全问题都发生在Web应用层上,他们可能会造成企业的域名被劫持、数据信息泄......
  • ​华为云网站安全解决方案,多重防御保护企业数据安全
    身处互联网时代,网络和信息安全始终都是人们关注的话题,对于企业来说也是一样。以网站安全为例,如果企业网站在安全防护措施方面存在不足,那么就很容易遭受黑客的击,轻则导致网站无法正常访问,重则导致敏感信息泄露,严重影响企业的正常经营,让企业蒙受巨大损失。同时,保护网络安全还是企业需......