首页 > 其他分享 >2023首届服务韧性工程(SRE)论坛分会场:数据中心运维的新发展

2023首届服务韧性工程(SRE)论坛分会场:数据中心运维的新发展

时间:2024-07-08 21:27:00浏览次数:19  
标签:数据中心 广通 运维 SRE 能力 2023 优云

2023年12月15日,2023首届服务韧性工程(SRE)论坛在杭州成功举行,大会邀请了来自通信、金融、医疗、制造行业等100余位SRE领域专业人士参加,本次大会特别设立了主题为“数据中心运维的新发展”的分会场,由广通优云和SRE专委会联合出品。邀请来自数据中心领域不同行业的产学研用的专家,就业务稳定性保障、智能化运维、可观测性等热点内容的技术发展及应用实践展开讨论。

SRE结合AIOps实现智能运维

SRE专委会发起人、雅菲奥朗咨询总监 刘峰

SRE专委会发起人,雅菲奥朗咨询总监 刘峰,进行《SRE结合AIOps实现智能运维》的主题分享,刘峰首先介绍到AIOps是将人工智能(AI)应用于IT运维的实践,并通过“观测、介入、行动”(OEA)循环的方式,来解决“运维超大规模云基础设施”所产生的问题,并认为AIOps对SRE团队、开发团队、DevOps团队都会产生重要的影响;

同时,认为人工智能工程师的市场需求巨大,但是对于从业者的岗位技能要求也更高;最后在提到SRE结合AIGC实现智能运维的路径上,他分享了几个行业专家的观点,并认为AIGC给智能运维带来的通识能力和推理能力将极大提升运维生产力。

数据中心服务能力成熟度新标准简介及应用展望

广通优云副总裁兼首席架构师 张凯

广通优云副总裁兼首席架构师 张凯,进行《数据中心服务能力成熟度新标准简介及应用展望》的主题分享,作为数据中心服务能力成熟度国标修订工作组首席专家,张凯首先介绍了本次国标修订的主要内容,包括能力模型框架、能力全景图、评价模型框架等;

其次从数智运营驱动数据中心数字化转型角度,在整体规划上重点突出平台保障及目标拆解,并详细讲解了“故障发现、定位和解决”,“流自一体能力”,“CMDB建设、运营、消费能力”等三大运维核心能力的建设要点;最后从自主信创、生态构建、标准认证、实践驱动等角度,分享如何驱动数据中心服务能力成熟度的提升。

涂鸦全球化稳定性保障

涂鸦智能基础技术负责人 金李东

涂鸦智能基础技术负责人 金李东,进行《涂鸦全球化稳定性保障》的主题分享,金李东介绍到作为全球化的IoT开发者平台,涂鸦在全球拥有6个数据中心,面临多云架构、技术文化、时差问题等运维挑战,在SRE理念与文化建设上,他提到要从规范研发流程、应急响应机制、定期对抗演练等方面进行完善;

在保障系统的体系建设方面,重点介绍了如何建立严格的项目研发与变更流程、防护保障体系、三位一体的监控体系、基于云原生的自动驾驶等内容;最后从基础设施平台化、大模型AI方向两个方面展望了未来的发展。

平台运维是企业运维数字化转型最佳路径

广通优云知识运营中心资深售前专家 李庆焐

广通优云知识运营中心资深售前专家 李庆焐,进行《平台运维是企业运维数字化转型的最佳路径》的主题分享,李庆焐介绍到从国内运维发展的历程及头部大行的生产实践,认为平台运维是运维数字化转型的方向,详细介绍了广通优云历经七年技术创新和沉淀,融合标杆用户的实践经验,打造的全新运维平台架构及应用生态;并重点介绍了行业级集约化能力、多云异构下的采控能力、数据治理和服务能力、流自一体能力等平台核心建设要点。

同时,也分享了包括基于应用资源图谱的故障诊断分析和快速自愈、应用全链路监控和洞察、自动化实现应用持续部署等运维场景应用,最后通过两家国有大行的实践案例,介绍了如何基于优云平台进行运维场景的创新共创和应用开发。

总结

运维数字化转型已势在必行,本次分论坛研讨会为数据中心运维领域的各位产学研用专家提供了一个交流平台,也希望可以为行业的技术发展与实践应用提供一些新的思考和方向。

标签:数据中心,广通,运维,SRE,能力,2023,优云
From: https://blog.csdn.net/weixin_46959162/article/details/140210146

相关文章

  • 必经之路-美团2023笔试(codefun2000)
    题目链接必经之路-美团2023笔试(codefun2000)题目内容塔子哥的班主任最近组织了一次户外拓展活动,让班里的同学们一起去爬山。在路上,塔子哥看到了一棵漂亮的树,他对这棵树产生了浓厚的兴趣,开始观察并记录这棵树的一些特征。塔子哥发现这棵树有n个节点,其中有一条边被特......
  • Asun安全学习【漏洞复现】CVE-2023-38831 WinRAR代码执行漏洞
    (ps:本人是小白,复现漏洞来进行安全学习,也借鉴了许多大佬的研究内容,感谢各位大佬进行指导和点评。)[漏洞名称]:CVE漏洞复现-CVE-2023-38831WinRAR代码执行漏洞[漏洞描述]:WinRAR是一款功能强大的Windows文件压缩和解压缩工具,支持高效的压缩算法、密码保护、分卷压缩、恢复记录等......
  • 打卡信奥刷题(267)用Scratch图形化工具信奥P10415 [普及组][蓝桥杯 2023 国 A] 切割
    [蓝桥杯2023国A]切割题目描述给定一个W×HW\timesHW×H的长方形,两边长度均为整数。小蓝想把它切割为......
  • Xmind Pro 2023 24安装包与安装教程
    下载链接:https://fcnkteazjvur.feishu.cn/docx/UatsdO0nSoYNDsxHb77cHzb6n2f点击右键,以管理员方式运行Xmind程序。点击"继续"。自动发送程序日志不打勾,点击"继续"。不用登录,直接点击"跳过"。自动安装后更新不打勾,点击忽略本次更新,并关掉Xmind软件。我们关闭Xmind......
  • 可视化作品集(09):可视化运维大屏不可或缺。
    可视化大屏在可视化运维上有很多价值,而且应用十分普遍,本文给老铁们分享一下。1.实时监控:可视化大屏可以实时展示系统运行状态、设备状态、生产数据等信息,使运维人员能够及时发现问题并做出相应的处理。2.数据分析:通过可视化大屏展示历史数据、趋势分析等,可以帮助运维......
  • 【DevOps】运维过程中经常遇到的Http错误码问题分析(一)
    一、解决HTTP408错误:上传3M文件时请求超时的问题在开发Web应用程序时,遇到HTTP408状态码(请求超时)是常见的问题。特别是在上传大文件时,这种情况更容易发生。本文将探讨在上传一个3M文件时,Web服务器返回408错误的原因,并提供详细的解决方案。1.理解HTTP408状态码HTTP408状......
  • 阿里云存储的降本增效与运维
    小浩负责公司存储架构层,需要确保存储层不会成为公司业务系统的性能瓶颈,让数据读写达到最佳性能。那么小浩可以从哪些方面着手优化性能呢?他继续求助系统架构师大雷。小浩:雷哥,PD反馈公司系统最近响应很慢,需要排除客户端、流量负载层、服务端、存储层各个模块哪里出现了瓶颈,我要......
  • 运维锅总详解CPU
    本文从CPU简介、衡量CPU性能指标、单核及多核CPU工作流程、如何平衡CPU性能和防止CPU过载、为什么计算密集型任务要选择高频率CPU、超线程技术、CPU历史演进及摩尔定律等方面对CPU进行详细分析。希望对您有所帮助!一、CPU简介CPU(中央处理器)的主要功能是执行计算机程序中......
  • IAP 2023 Day1
    HTMLHTML是Hypertextmarkuplanguage(超文本标记语言),你可以理解为网页的结构。<!DOCTYPEhtml><html><head><title>ProfilePage</title><linkrel="stylesheet"href="https://maxcdn.bootstrapcdn.com/bootstrap/4.0.0-beta......
  • 【2023-2024第二学期】助教工作学期总结——数字电路与逻辑设计助教
    一、助教工作的具体职责和任务协助教师引导大一转专业学生如何学习本门课程,收集学生问题、定期答疑、协助教师批改作业并跟踪作业完成情况,实验指导,改进课程建设。指导学生学习《数字电路与逻辑设计》。并指导学生完成《数字电路与逻辑设计实验》。二、助教工作的每周时长和具体......