首页 > 其他分享 >故障排查

故障排查

时间:2023-02-20 21:14:20浏览次数:32  
标签:Node kubectl drain 故障 -- 排查 Pod pod

//查看Pod事件
kubectl describe TYPE NAME_PREFIX

//查看Pod日志(Failed状态下)
kubectl logs <POD_NAME> [-c Container_NAME]

//进入Pod(状态为running,但是服务没有提供)
kubectl exec –it <POD_NAME> bash

//查看集群信息
kubectl get nodes

//发现集群状态正常
kubectl cluster-info

//查看kubelet日志发现
journalctl -xefu kubelet


##对节点执行维护操作:
kubectl get nodes

//将 Node 标记为不可调度的状态,这样就不会让新创建的 Pod 在此 Node 上运行
kubectl cordon <NODE_NAME>          #该node将会变为SchedulingDisabled状态

//kubectl drain 可以让 Node 节点开始释放所有 pod,并且不接收新的 pod 进程。drain 本意排水,意思是将出问题的 Node 下的 Pod 转移到其它 Node 下运行
kubectl drain <NODE_NAME> --ignore-daemonsets --delete-local-data --force

--ignore-daemonsets:无视 DaemonSet 管理下的 Pod。
--delete-local-data:如果有 mount local volume 的 pod,会强制杀掉该 pod。
--force:强制释放不是控制器管理的 Pod,例如 kube-proxy。

注:执行 drain 命令,会自动做了两件事情:
(1)设定此 node 为不可调度状态(cordon)
(2)evict(驱逐)了 Pod

//kubectl uncordon 将 Node 标记为可调度的状态
kubectl uncordon <NODE_NAME>

标签:Node,kubectl,drain,故障,--,排查,Pod,pod
From: https://www.cnblogs.com/ponyton/p/17138926.html

相关文章

  • 自动故障感知以及服务实例自动摘除源码剖析
    1每隔1min调度一次EvictionTask这个任务,感知是否有实例故障,并摘除eureka-server初始化完成,进入下面这个方法registry.openForTraffic(applicationInfoManager,regist......
  • 通过一个具体的例子,深入了解 SAP UI5 控件数据双向绑定的工作原理和问题排查方法试读
    笔者知识星球里有朋友提问:SAPUI5中的sap.m.select控件,在当前页面做任何操作时,都可以选中key值,但触发dialog之后,可以看到select框内的key值被清空,当关闭dialo......
  • 网站返回504排查记录
    tengine配置的全局超时时间是120s,供应商说他们的请求会超过120s。于是我针对这个域名配置了相关的超时时间。配置如下:proxy_connect_timeout600;proxy_send_timeout......
  • elastic-job服务启动报错,问题排查
     elastic-job服务启动报错,报错信息:org.quartz.SchedulerException:Jobthrewanunhandledexception.atorg.quartz.core.JobRunShell.run(JobRunShell.java:213)at......
  • Java-webshell 排查
    参考:https://javasec.org/javaweb/MemoryShell/https://goodapple.top/archives/1355简介本次分享为javawebshell排查初级。抛砖引玉java获取web权限的shell......
  • 故障案例:MySQL唯一索引有重复值,官方却说This is not a bug
    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。作者:飞鱼过天文章来源:GreatSQL社区原创......
  • linux脚本禁止修改排查
    问题描述同事发过来一个脚本,说怎么修改都修改不了保存提示:warning:Changingareaedonlyfile//orOperationnotpermitted提示没权限,不过我都是root了问题......
  • Springboot项目中注入bean失败的问题排查
    Springboot项目中注入bean失败的问题排查这是一个Spring常见的问题,下面我们从测试方法和普通方法出问题两个角度来下如何解决测试方法先查看目录是否有误测试类的包名......
  • 排查java进程问题
    1.先用jps命令查出java进程号2.使用top命令查出该进程使用cpu最高、占用内存最大的线程(嫌疑最大)这里我们选取微服务项目中的主进程24240top-Hp24240-d1-n13......
  • CAN总线错误帧及排查方法简介
    前言  CAN帧有多种格式,错误帧作为CAN帧中独特的一种,了解其作用,类型与产生原因,对于进行测试以及开发有很大的帮助,本文将对错误帧的相关基础知识以及后续的分析排查进行......