故障排查思路
节点处于NotReady
节点是由kubelet管理的,所以要先检查kubelet的相关情况
排查思路:
- 查看kubelet和docker服务是否正常
systemctl status kubectl
systemctl status docker
- 查看kubelet的日志或者重启kubelet并查看日志
systemctl restart kubectl
# 查看日志 注意辨别日志 有些错误日志 并不影响
journalctl -u kubelet -f
pod运行不正常
关于pod状态的描述 https://kubernetes.io/zh-cn/docs/concepts/workloads/pods/pod-lifecycle/
- 查看pod详情
kubectl describe pod <podName>
- 查看pod日志
kubectl logs pod <podName>
- 查看节点状态
kubectl get node
- 查看事件
kubectl get events
互联网用户无法访问应用(ingress或service无法访问)
- pod工作正常吗
- service是否关联pod
- service指定的target port是否正确
- 如果使用名称访问,dns是否正常工作
- kube-proxy是否正常工作
- CNI网络插件是否正常工作 比如calico