首页 > 其他分享 >使用aigc进行运维SRE岗面试

使用aigc进行运维SRE岗面试

时间:2024-01-26 15:11:26浏览次数:38  
标签:怎么 运维 SRE mmbiz image aigc Pod png

原文链接:

百度SRE岗面试复盘

SRE岗面试复盘- K8S篇

SRE岗面试复盘- 可观测性篇
‍‍‍

SRE岗面试复盘(外企篇)

SRE岗面试复盘(某Top私募量化)

经验方案

  1. 微服务应用迁移到 Kubernetes ,流量如何接入切换?图片

  2. 微服务架构迁移 Kubernetes, 主要做了哪些工作, 中间有遇到什么难点?图片

    图片

    image-20240126104353650

  3. 为什么要迁移 Kubernetes ?图片图片

  4. 如果让你迁移百度的现有应用到K8S上面, 需要做哪些工作?图片图片

  5. 如果让你改进你们公司现有的监控系统,你会从哪些方向改进优化?图片图片

  6. 聊聊了成本优化的问题
    图片图片

  7. Kubernetes 运维中经常遇到的问题是什么,讲讲实际案例?图片图片

  8. 聊了聊现有公司的业务, Kubernetes 的架构,云架构图片

  9. 给客户的一批机器过保了,作为运维应该怎么处理?图片图片

稳定性


  1. 系统架构高可用,应该怎么实现?图片图片

  2. 容量规划怎么做的?(基于AWS 的auto scaling group机制的讨论)图片

  3. 让你做多活架构设计的话, 几个机房合适?图片

  4. 如何实现服务稳定性的保障?图片图片

  5. 让你针对百度或者抖音等APP做性能测试报告,你会怎么出 ?图片图片

  6. 对SRE的理解 , SRE最重要的需要什么能力 ?图片

  7. SRE 的关注点?图片

  8. SLA SLO SLI 该怎么做?图片图片

  9. On-Call 的流程?incident management 流程的讨论图片图片

  10. K8S 架构, 多少节点 ?  怎么管理的?图片

  11. 论到多集群,Centralized cluster 怎么和其他 cluster交互 ?图片

  12. 上云 网络架构的讨论 (VPC Peering)图片

可观测性

  1. 监控这块怎么做的 ?图片

  2. 混沌工程  如何做的故障注入 ?图片

  3. 怎么推动该混沌工程的落地实施?图片

  4. 从传统监控迁移到Prometheus&thanos架构?有什么优势?

    图片

    image-20240126114703503

  5. 你们公司的系统监控metric的量级在多少  ?都监控了哪些指标 ?

  6. ES 日志量多少 ?ES 架构 ?

  7. 搭建的可观测性平台, 怎么对业务做到可观测性的提高?![image-20240126123606349](/Users/wangzhi4/Library/Application Support/typora-user-images/image-20240126123606349.png)图片

  8. 做SLO 的指标标准是怎么来的, 比如某个SLI 达到多少是异常 , 大于500ms是异常,这个是怎么评估的 ?图片图片

  9. 传统监控和 可观测性有什么区别?为什么要做可观测性?图片

  10. Prometheus 指标类型图片

  11. 直方图 ,summary 有什么区别 ?(回答不太好,本质是 summary在客户端计算, histogram在服务端计算)图片

  12. rate 和 irate 有什么区别?

(举个例子:最后两个采集点没有数据的话,rate 和 irate  分别的值怎么算的)![图片](https://mmbiz.qpic.cn/sz_mmbiz_png/muS5JJVFcw8XSBP74ibp2jBSiaOEQCqs22cgvd3ylzR0QTgbGOPIuSyiaxK7HClnxDNMHFFx7ibSsbzukXWFv4icFQg/640?wx_fmt=png&from=appmsg)
  1. Prometheus 写过exporter? 具体细节?

  2. Prometheus怎么自动发现mertic的 ?图片

  3. Prometheus性能调优?图片图片

  4. tracing 怎么做的 ?(从opentelemetry&zipkin 到tempo再到cilium网络插件)图片图片

  5. ebpf的probe有哪些?图片

  6. tracepoint了解吗,怎么用 ?图片图片

  7. ebpf是怎么监控性能的?图片

DevOps

  1. 自动化做了哪些工作? 有涉及到 故障自愈 ,智能运维的级别吗 ?图片

  2. terraform Dynamic block 怎么用图片图片

  3. Count  语法、   for_each 语法 ?图片图片

  4. terraform 文件结构 (best pratices)图片图片

  5. Ansible 配置中, 怎么做并发执行同时跑更多任务?图片

  6. 你们是怎么做CICD的 , 构建CICD 过程中遇到哪些问题 ?

    图片

    image-20240126125715284

  7. 可以再具体深入点, 怎么触发CD机制的?图片

  8. 运维自动化你做过哪些,你觉得最有成就的 ?图片

  9. 发布版本的策略都有哪些?

    图片

    image-20240126130031656

  10. 蓝绿发布解释下 ?图片

  11. 详细描述一下之前工作中代码提交的这个过程?图片图片

  12. git rebase和commit有什么区别图片

  13. 实现下字符串反转(分别按单字母以及word来反转)图片

  14. Shell ?0   代表什么 ?图片

  15. Shell  怎么查看 参数个数 ?图片

  16. 给定个字符串,怎么通过变量做字符串截取?图片

  17. shell中 怎么进行 数值计算?图片图片

  18. Python的多进程和多线程图片

![图片](https://mmbiz.qpic.cn/sz_mmbiz_png/muS5JJVFcw8XSBP74ibp2jBSiaOEQCqs22qmw1Aia1x1rXHJpJIF5f8h779s93xvTdaCF9xRRs2n0HXLzeJMNbVOw/640?wx_fmt=png&from=appmsg)

image-20240126131142693
  1. GIL解释器图片

K8s 基础知识

  1. 怎么查看 Node 上跑了哪些 Pod ?(Describe 更简单)图片

  2. Pod 怎么跑到指定节点上 ?图片图片

  3. 怎么限制某个特定 Pod 的的网络带宽?gpt 回答不准,calico 实现方式是通过如下注解

          annotations:
            kubernetes.io/ingress-bandwidth: 10M
            kubernetes.io/egress-bandwidth: 10M
    
    
  4. Pod 健康检查机制?liveness 和 readiness的区别 ?图片

  5. Pod 服务挂了,怎么排错?思路?图片图片

  6. 怎么做到在多个容器的 Pod 里面,只重启某个容器 ?图片

  7. Deployment 创建 Pod 的过程, 涉及到的K8S组件有哪些?图片图片

  8. Deployment 升级策略图片图片

  9. Deployment滚动更新过程图片

  10. 怎么控制滚动更新过程图片

  11. Kubernetes Replication Controller:负责执行控制什么图片

  12. Deployment 更新过程 ,replicaset  正在更新过程中,新的replicaset提交,  会有什么效果?图片

  13. Service 有哪几种类型 ?(还有 headless)图片

  14. Service 中 iptables 原理 (kube-proxy)图片

  15. Ingress是什么?‍‍图片

  16. 服务流量不通了,需要做故障排查,都会查哪些地方?排查思路 gpt 回答的不好,看我总结这个吧还是图片

  17. Calico的网络模式 有哪些 ?IPIP, BGP 都怎么实现的 ?两种模式有什么区别 ?(回答的也不好)

![图片](https://mmbiz.qpic.cn/sz_mmbiz_png/muS5JJVFcw8XSBP74ibp2jBSiaOEQCqs22PoqFcEB4ian4IWmZRIcPmmCxLWnCcljEMIxFpmty5dn2jwicFSiaNpJYg/640?wx_fmt=png&from=appmsg)

image-20240126133210932
  1. kube schedule的调度机制?图片

  2. kube schedule 坏了的话,还有其他什么方式去跑起来 Pod? 回答的不好, 个人感觉方法是 静态Pod

  3. Pod 经过scheduler,这一步之后Pod的会多出什么属性?图片

  4. kubectl apply 创建一个pod的过程,具体说说 回答不好,看这个吧图片

  5. K8S QoS
    图片图片

  6. K8S怎么做升级的,升级需要考虑什么?‍‍图片图片

  7. Dockerfile ADD和 COPY 有什么区别 ?图片

  8. Docker 底层技术实现图片

  9. Docker 网络模式图片图片

  10. K8S node  not ready 不可用,该怎么排查原因?图片图片

  11. docker run跑了一个容器,但发现这个容器啊没有运行成功,那可以通过什么方法去排查?图片图片

  12. docker 常见错误码有哪些 ?退出码 137是什么 ?图片

  13. cmd 和 entrypoint  有什么区别?图片

  14. Docker 怎么实现资源隔离 ?图片

  15. 容器想去访问主机上面的一些资源,要怎么打破这个隔离呢?图片

  16. Dockerfile 的最佳实践,怎么写比较优雅?图片图片

![图片](https://mmbiz.qpic.cn/sz_mmbiz_png/muS5JJVFcw8XSBP74ibp2jBSiaOEQCqs22390ZGxOT1lZZZCwsibqyicic5yGssKUiaN33wGPsACS8soQ1uGC5LWeYicw/640?wx_fmt=png&from=appmsg)

image-20240126134954814

标签:怎么,运维,SRE,mmbiz,image,aigc,Pod,png
From: https://www.cnblogs.com/ipyanthony/p/17989446

相关文章

  • 服务器运维小技巧(二)——如何进行监控告警
    服务器运维难度高的原因,很大程度是因为服务器一旦出现问题,生产环境的业务就会受到严重影响,极有可能带来难以承担的后果。因此这份工作要求工程师保持高要求的服务质量,能够快速响应问题,及时解决问题。但是“及时”的这一点很难做到,需要通过优化工作流程、建立预警系统,搭建自动化等行......
  • 《数字化运维路线图》第二部分 震撼发布!
    继《数字化运维路线图》第一部分「数字化运维组织升级」获得业界广泛关注后,我们迎来了第二部分的发布——「数字化运维转型标准流程」。本流程充分调研和分析现有工作流程中存在的不足,结合企业的数字化战略目标与业务特点而制定,旨在为企业提供一套全面、标准化的数字化运维流程管理......
  • 一体化运维的发展趋势与未来展望
      随着信息技术的迅猛发展,企业的IT系统已经从单一的、孤立的应用转变为多元化、复杂化的系统集群。云计算、大数据、物联网等前沿技术的广泛应用,使得企业的IT运维面临着前所未有的挑战。在这样的背景下,一体化运维作为一种新型的运维模式,应运而生,并逐渐成为企业IT运维的主流趋势......
  • openGauss学习笔记-207 openGauss 数据库运维-常见故障定位案例-btree 索引故障情况下
    openGauss学习笔记-207openGauss数据库运维-常见故障定位案例-btree索引故障情况下应对策略207.1btree索引故障情况下应对策略207.1.1问题现象偶发索引丢失错误,报错如下。ERROR:index'xxxx_index'containsunexpectedzeropage或ERROR:index'pg_xxxx_index'cont......
  • ELK运维文档
    Logstash目录LogstashMonitoringAPINodeInfoAPIPluginsInfoAPINodeStatsAPIHotThreadsAPIlogstashexporter指标插件管理离线安装插件更新插件移除插件使用Gem私有库性能调优TroubleshootingLogstashFAQlogstash可能出现的问题?如何保证logstash事件不丢失?logstash是否......
  • /run/initramfs/rdsosreport.txt 报错
     vmwarecentos7虚拟机出现Generating/run/initramfs/rdsosreport.txt问题? 解决步骤1.使用命令ls/dev/mapper列出/dev/mapper目录下的文件,查看后缀为“-root”的文件ls/dev/mapper#接着大概率会出现这三个文件centos-rootcentos-swapcontrol2.使用命令xfs_repai......
  • 系统运维-一次zabbix业务培训
    记录一次自己使用zabbix做设备监控的培训PPT,基于zabbix3.4,相关技术已经过时,但是具有参考意义,2017年客户培训使用......
  • openGauss学习笔记-206 openGauss 数据库运维-常见故障定位案例-too many clients alr
    openGauss学习笔记-206openGauss数据库运维-常见故障定位案例-toomanyclientsalready206.1高并发报错“toomanyclientsalready”或无法创建线程206.1.1问题现象高并发执行SQL,报错“sorry,toomanyclientsalready”;或报无法创建线程、无法fork进程等错误。206.1.2......
  • 通过CanvasRenderer.SetColor和Image.color修改UI组件颜色的区别
    1)通过CanvasRenderer.SetColor和Image.color修改UI组件颜色的区别2)OPPO相关机型没法在Unity启用90或120FPS3)手机输入法中的emoji4)UnityApplicationPatching怎么用这是第369篇UWA技术知识分享的推送,精选了UWA社区的热门话题,涵盖了UWA问答、社区帖子等技术知识点,助力大家更全面......
  • 【Windows运维系列5】自动识别并封堵恶意IP,让你的Windows服务器安全更上一层楼
    在前面的文章中,我们介绍了在我为一位使用Hostease的服务器客户进行了安全加固,通过bat批处理脚本来实现自动修改服务器Windows操作系统的远程端口,建立了非常可靠的登陆安全防护,让我们的Windows服务器更安全。虽然国内有像360安全卫士这样的软件,功能确实非常强大,但是功能太多了,如果设......