首页 > 其他分享 >在K8S中,节点故障pod驱逐pod过程,时间怎么定义的?

在K8S中,节点故障pod驱逐pod过程,时间怎么定义的?

时间:2024-07-25 12:08:41浏览次数:15  
标签:驱逐 节点 故障 时间 Pod K8S pod

在Kubernetes(K8S)中,节点故障导致Pod驱逐的过程是一个涉及多个组件和参数协同工作的复杂流程。这个过程的时间定义主要通过一系列参数来配置和确定。以下是该过程的详细解释以及时间定义的说明:

一、节点故障检测
  1. 节点控制器(Node Controller)检查间隔:
    • node-monitor-period:这是节点控制器检查每个节点健康状态的间隔时间。默认值为5秒。即每5秒,节点控制器会尝试与集群中的每个节点进行通信,以确认其状态。
  2. 节点故障判断时间窗口:
    • node-monitor-grace-period:这是节点控制器在判断节点为故障之前等待的时间窗口。默认值为40秒。如果在40秒内节点控制器没有收到节点的响应或确认消息,则节点控制器会将该节点标记为“NotReady”状态。
二、Pod驱逐过程
  1. Pod保留时间:
    • pod-eviction-timeout:当节点被标记为故障后,kubelet允许Pod在此故障节点上保留的时间。默认值为300秒(即5分钟)。这意味着,从节点被标记为故障开始,kubelet会等待5分钟,然后再开始驱逐该节点上的Pod。
  2. 驱逐过程:
    • 一旦超过pod-eviction-timeout设置的时间,kubelet会开始将故障节点上的Pod驱逐到其他健康的节点上。这个过程包括终止Pod中的容器、清理相关资源等。
三、时间定义总结
  • 总时间:从节点故障开始到Pod被完全驱逐到其他节点,整个过程的时间大致为node-monitor-grace-period + pod-eviction-timeout,即40秒 + 300秒 = 340秒(约5分40秒)。但需要注意的是,这个时间是从节点被标记为故障状态开始计算的,而节点被标记为故障状态之前还有node-monitor-period的等待时间(5秒)。
  • 调整参数:在实际操作中,这些参数(如node-monitor-period、node-monitor-grace-period和pod-eviction-timeout)可以根据需要进行调整,以优化集群的故障恢复能力和资源利用率。
四、注意事项
  • Pod状态变化:在驱逐过程中,Pod的状态不会立即改变。在pod-eviction-timeout时间内,原本是Running的Pod状态将保持不变。当超过这个时间后,这些Pod的状态会变为Nodelost(对于DaemonSet)或Unknown(对于Deployment)。
  • 优雅终止:在驱逐Pod之前,Kubernetes会尝试优雅地终止Pod中的容器,以确保应用程序有足够的时间完成正在进行的任务并释放资源。这通过发送SIGTERM信号给容器中的进程来实现,并等待一段配置的时间(terminationGracePeriodSeconds)让进程自行终止。

综上所述,我们可以清楚地了解到Kubernetes中节点故障导致Pod驱逐的过程及其时间定义。这些参数和流程确保了集群在节点故障时能够迅速恢复服务,并保持高可用性。

标签:驱逐,节点,故障,时间,Pod,K8S,pod
From: https://www.cnblogs.com/huangjiabobk/p/18322695

相关文章

  • 在K8S中,滚动更新的过程是什么?
    在Kubernetes(K8S)中,滚动更新是一种更新应用程序的方式,它允许逐步替换旧版本的Pods以使用新版本的Pods,从而减少停机时间,并确保服务的连续性。以下是滚动更新的详细过程:定义Deployment资源:首先,需要定义一个Deployment资源,它描述了Pods的期望状态和更新策略。Deployment负责管理P......
  • 在K8S中,k8s删除pod的过程是什么?
    在Kubernetes(K8s)中,删除Pod的过程是一个涉及多个步骤和组件协作的流程。以下是K8s删除Pod的详细过程:一、连接到Kubernetes集群首先,用户或系统需要连接到Kubernetes集群。这通常通过kubectl命令行工具或其他KubernetesAPI客户端实现。kubectl是Kubernetes的官方命令行工具,用于与K......
  • 【云原生之kubernetes实战】在k8s环境下部署go-file文件分享工具
    【云原生之kubernetes实战】在k8s环境下部署go-file文件分享工具一、go-file介绍1.1go-file简介1.2go-file特点1.3go-file使用场景二、本次实践介绍2.1本次实践简介2.2本次环境规划2.3本次实践存储介绍2.4k8s存储介绍三、检查k8s环境3.1检......
  • k8s-node节点平滑维护
    目录Kubernetes节点管理:cordon、drain和delete命令1.cordon命令2.drain命令3.delete命令4.节点平滑维护的推荐步骤Kubernetes节点管理:cordon、drain和delete命令在Kubernetes集群中,管理节点时常涉及到将节点从调度中排除以便进行维护。常用的操作包括cordon、d......
  • 如何使用 Django 在 neo4j 中创建节点
    我正在开发一个网络应用程序。对于后端,我选择了Django,作为数据库,我想使用图形数据库,所以我选择了neo4j。有一个Python库neomodel用于使用neo4j和一个特定的库django_neomodel要合并|||使用Django。neomodel我可以使用Django和neo4j从......
  • 在K8S中,容器提供一个服务,外部访问慢,到底是容器网络问题?还是容器服务问题?这种怎么排查?
    在K8S(Kubernetes)中,当容器提供的服务外部访问慢时,可能是由容器网络问题或容器服务问题中的一个或多个因素导致的。为了有效排查这个问题,可以按照以下步骤进行:一、初步排查检查外部访问方式:确认外部是通过哪种方式访问服务的,如LoadBalancer、NodePort、Ingress等。检查相应的......
  • 在K8S中,我们公司用户反应pod连接数非常多,希望看一下这些连接都是什么信息?什么状态?怎么
    在K8S中,当用户反映Pod连接数非常多时,为了查看这些连接的具体信息和状态,并考虑到容器内没有集成bash环境和网络工具的情况,可以采取以下步骤进行排查:一、确认问题并收集信息查看Pod状态:使用kubectlgetpods命令查看Pod列表,确认哪个Pod的连接数异常。使用kubectldescribepod......
  • 在K8S中,calico和cilium这两种cni有什么区别?cailico的ipip模型和ciliume的vxlan模型,两
    在Kubernetes(K8S)中,Calico和Cilium是两种流行的容器网络接口(CNI)插件,它们各自具有独特的特点和优势。下面将详细比较这两种CNI插件,并探讨Calico的IPIP模型和Cilium的VXLAN模型在数据处理上的差异。1.Calico与Cilium的区别CalicoCilium基础架构基于BGP的纯三层网络方案......
  • 在K8S中,外部访问容器服务,比如说提供了一个域名,链路怎么走?数据经过哪些组件?
    在K8S(Kubernetes)中,外部访问容器服务并涉及到一个域名时,整个访问链路会经过多个组件,确保请求能够正确地被路由到目标服务。以下是详细的链路流程和涉及的组件:1.链路流程域名解析:当用户在浏览器或客户端输入域名时,首先会进行DNS解析。DNS服务器会将域名解析为对应的IP地址。......
  • 在K8S中,cailico的ipip模型和ciliume的vxlan模型除了在具体的实现不同,在原理上有何区别
    在Kubernetes中,Calico的IP-in-IP(IPoverIP)模型和Cilium的VXLAN(VirtualeXtensibleLocalAreaNetwork)模型都旨在解决跨主机通信的问题,但它们在原理上有着本质的区别,这些差异主要体现在数据包的封装、网络层级、性能影响以及网络策略的实施上。1.Calico的IPIP模型原理:IPIP(IP......