k8s 1.15.0
问题现象
node2上产生磁盘压力前状态
node2上产生磁盘压力后guaranteed Pod和ds Pod被驱逐
nginx-deployment Pod被驱逐后容忍污点调度到node2,kubelet二次确认否决,继续驱逐
pkg/kubelet/eviction/eviction_manager.go
Admit方法
1. 接受关键Pod
2. 节点存在内存压力,接受qos非BestEffort的Pod
3. 节点存在内存压力,接受qos是BestEffort且可以容忍当前污点的Pod
4. 拒绝该Pod,Pod Phase设置为Failed
关键Pod
https://v1-22.docs.kubernetes.io/zh/docs/reference/command-line-tools-reference/feature-gates/
PodPriority默认开启
ExperimentalCriticalPodAnnotation已在1.13版本废弃,推荐优先级设置。
成为关键Pod的充分条件(满足之一即可)
1.开启PodPriority特性开关,设置Pod优先级达到20亿以上
2.开启ExperimentalCriticalPodAnnotation特性开关,kube-system命名空间下Pod带有注解scheduler.alpha.kubernetes.io/critical-pod且值是""
pkg/kubelet/types/pod_update.go
IsCriticalPod函数
验证高优先级Pod是否不会被驱逐
kube-system命名空间下设置了20亿优先级的Pod依然被驱逐
pkg/kubelet/eviction/eviction_manager.go
synchronize方法
对应kubelet日志
evictPod方法
只有Pod是关键Pod且是静态Pod,才不会被驱逐。
例如kube-apiserver这个静态Pod满足不驱逐的条件
参考资料
深入分析Kubernetes Critical Pod(二)