在K8S中，节点故障pod驱逐pod过程，时间怎么定义的？

时间：2024-07-25 12:08:41浏览次数：15

标签：驱逐节点故障时间 Pod K8S pod

在Kubernetes（K8S）中，节点故障导致Pod驱逐的过程是一个涉及多个组件和参数协同工作的复杂流程。这个过程的时间定义主要通过一系列参数来配置和确定。以下是该过程的详细解释以及时间定义的说明：

一、节点故障检测

节点控制器（Node Controller）检查间隔：
- node-monitor-period：这是节点控制器检查每个节点健康状态的间隔时间。默认值为5秒。即每5秒，节点控制器会尝试与集群中的每个节点进行通信，以确认其状态。
节点故障判断时间窗口：
- node-monitor-grace-period：这是节点控制器在判断节点为故障之前等待的时间窗口。默认值为40秒。如果在40秒内节点控制器没有收到节点的响应或确认消息，则节点控制器会将该节点标记为“NotReady”状态。

二、Pod驱逐过程

Pod保留时间：
- pod-eviction-timeout：当节点被标记为故障后，kubelet允许Pod在此故障节点上保留的时间。默认值为300秒（即5分钟）。这意味着，从节点被标记为故障开始，kubelet会等待5分钟，然后再开始驱逐该节点上的Pod。
驱逐过程：
- 一旦超过pod-eviction-timeout设置的时间，kubelet会开始将故障节点上的Pod驱逐到其他健康的节点上。这个过程包括终止Pod中的容器、清理相关资源等。

三、时间定义总结

总时间：从节点故障开始到Pod被完全驱逐到其他节点，整个过程的时间大致为node-monitor-grace-period + pod-eviction-timeout，即40秒 + 300秒 = 340秒（约5分40秒）。但需要注意的是，这个时间是从节点被标记为故障状态开始计算的，而节点被标记为故障状态之前还有node-monitor-period的等待时间（5秒）。
调整参数：在实际操作中，这些参数（如node-monitor-period、node-monitor-grace-period和pod-eviction-timeout）可以根据需要进行调整，以优化集群的故障恢复能力和资源利用率。

四、注意事项

Pod状态变化：在驱逐过程中，Pod的状态不会立即改变。在pod-eviction-timeout时间内，原本是Running的Pod状态将保持不变。当超过这个时间后，这些Pod的状态会变为Nodelost（对于DaemonSet）或Unknown（对于Deployment）。
优雅终止：在驱逐Pod之前，Kubernetes会尝试优雅地终止Pod中的容器，以确保应用程序有足够的时间完成正在进行的任务并释放资源。这通过发送SIGTERM信号给容器中的进程来实现，并等待一段配置的时间（terminationGracePeriodSeconds）让进程自行终止。

综上所述，我们可以清楚地了解到Kubernetes中节点故障导致Pod驱逐的过程及其时间定义。这些参数和流程确保了集群在节点故障时能够迅速恢复服务，并保持高可用性。

标签：驱逐,节点,故障,时间,Pod,K8S,pod
From： https://www.cnblogs.com/huangjiabobk/p/18322695

在K8S中，滚动更新的过程是什么？
在Kubernetes（K8S）中，滚动更新是一种更新应用程序的方式，它允许逐步替换旧版本的Pods以使用新版本的Pods，从而减少停机时间，并确保服务的连续性。以下是滚动更新的详细过程：定义Deployment资源：首先，需要定义一个Deployment资源，它描述了Pods的期望状态和更新策略。Deployment负责管理P......
在K8S中，k8s删除pod的过程是什么？
在Kubernetes（K8s）中，删除Pod的过程是一个涉及多个步骤和组件协作的流程。以下是K8s删除Pod的详细过程：一、连接到Kubernetes集群首先，用户或系统需要连接到Kubernetes集群。这通常通过kubectl命令行工具或其他KubernetesAPI客户端实现。kubectl是Kubernetes的官方命令行工具，用于与K......
【云原生之kubernetes实战】在k8s环境下部署go-file文件分享工具
【云原生之kubernetes实战】在k8s环境下部署go-file文件分享工具一、go-file介绍1.1go-file简介1.2go-file特点1.3go-file使用场景二、本次实践介绍2.1本次实践简介2.2本次环境规划2.3本次实践存储介绍2.4k8s存储介绍三、检查k8s环境3.1检......
k8s-node节点平滑维护
目录Kubernetes节点管理：cordon、drain和delete命令1.cordon命令2.drain命令3.delete命令4.节点平滑维护的推荐步骤Kubernetes节点管理：cordon、drain和delete命令在Kubernetes集群中，管理节点时常涉及到将节点从调度中排除以便进行维护。常用的操作包括cordon、d......
如何使用 Django 在 neo4j 中创建节点
我正在开发一个网络应用程序。对于后端，我选择了Django，作为数据库，我想使用图形数据库，所以我选择了neo4j。有一个Python库neomodel用于使用neo4j和一个特定的库django_neomodel要合并|||使用Django。neomodel我可以使用Django和neo4j从......
在K8S中，容器提供一个服务，外部访问慢，到底是容器网络问题？还是容器服务问题？这种怎么排查？
在K8S（Kubernetes）中，当容器提供的服务外部访问慢时，可能是由容器网络问题或容器服务问题中的一个或多个因素导致的。为了有效排查这个问题，可以按照以下步骤进行：一、初步排查检查外部访问方式：确认外部是通过哪种方式访问服务的，如LoadBalancer、NodePort、Ingress等。检查相应的......
在K8S中，我们公司用户反应pod连接数非常多，希望看一下这些连接都是什么信息？什么状态？怎么
在K8S中，当用户反映Pod连接数非常多时，为了查看这些连接的具体信息和状态，并考虑到容器内没有集成bash环境和网络工具的情况，可以采取以下步骤进行排查：一、确认问题并收集信息查看Pod状态：使用kubectlgetpods命令查看Pod列表，确认哪个Pod的连接数异常。使用kubectldescribepod......
在K8S中，calico和cilium这两种cni有什么区别？cailico的ipip模型和ciliume的vxlan模型，两
在Kubernetes（K8S）中，Calico和Cilium是两种流行的容器网络接口（CNI）插件，它们各自具有独特的特点和优势。下面将详细比较这两种CNI插件，并探讨Calico的IPIP模型和Cilium的VXLAN模型在数据处理上的差异。1.Calico与Cilium的区别CalicoCilium基础架构基于BGP的纯三层网络方案......
在K8S中，外部访问容器服务，比如说提供了一个域名，链路怎么走？数据经过哪些组件？
在K8S（Kubernetes）中，外部访问容器服务并涉及到一个域名时，整个访问链路会经过多个组件，确保请求能够正确地被路由到目标服务。以下是详细的链路流程和涉及的组件：1.链路流程域名解析：当用户在浏览器或客户端输入域名时，首先会进行DNS解析。DNS服务器会将域名解析为对应的IP地址。......
在K8S中，cailico的ipip模型和ciliume的vxlan模型除了在具体的实现不同，在原理上有何区别
在Kubernetes中，Calico的IP-in-IP（IPoverIP）模型和Cilium的VXLAN（VirtualeXtensibleLocalAreaNetwork）模型都旨在解决跨主机通信的问题，但它们在原理上有着本质的区别，这些差异主要体现在数据包的封装、网络层级、性能影响以及网络策略的实施上。1.Calico的IPIP模型原理：IPIP（IP......

在K8S中，节点故障pod驱逐pod过程，时间怎么定义的？

一、节点故障检测

二、Pod驱逐过程

三、时间定义总结

四、注意事项

相关文章

赞助商

阅读排行