Health Check:由发起者对容器进行周期性检测 dockers health check实现方式: #第一种方式:docker-compose cat <<EOF >docker-compose.yaml version: '3.6' service: nginx-service: image: nginx expose: - 80 - 443 ports: - "80:80" - "443:443" restart: always healthcheck: #添加服务健康状态检查 test: ["CMD", "curl", "-f", "http://localhost"] interval: 5s #健康状态检查的间隔时间,默认为30s timeout: 5s #单次检查的失败超时时间,默认为30s retries: 3 #连续失败次数默认3次,当连续失败retrise次数后将容器置为unhealthy状态 start_period: 60s #容器启动60s后,interval做第一次健康检查 EOF #第二种方式:dockerfile制作镜像的时候加上 FROM nginx:1.20.2 HEALTHCHECK --interval=5s --timeout=2s --retries=3 CMD curl --silent --fail localhost:80 || exit 1 验证:
- 在检查通过之前容器处于starting状态
- 检测通过(检测返回状态码为0)之后为healthy状态
- 检测失败(检测返回状态码为1)之后为unhealthy状态
- ExecAction:在容器执行指定命令,如果命令退出时返回码为0则认为诊断成功
- TCPSocketAction:对指定端口上的容器的IP地址进行TCP检查,如果端口打开,则诊断成功
- HTTPGetAction:对容器指定的端口和地址执行HTTPGet请求,如果相应的状态码是200和400之间(包括200小于400),则诊断被认为是成功的
- Always:当容器异常的时,k8s自动重启该容器,默认为Always
- OnFailure:当容器失败时(容器停止运行退出码不为0),k8s自动重启该容器
- Never:不论容器运行状态如何都不会重启该容器,适用于Job或CronJob
- IfNotPresent:node节点没有此镜像就去指定镜像仓库拉取,node服务器有镜像就使用node本地镜像
- Always:每次pod重建都会重新拉取镜像
- Nerver:从不到镜像仓库拉取镜像,只使用本地镜像
- startupProbe:判断容器内的应用程序是否已经启动完成,配置启动探测后,会先禁用其他探测,直到startupProbe检测成功为止,如果startupProbe检测失败,kubelet会杀掉容器,然后根据配置的restartPolicy策略决定是否启动,如果没有配置startupProbe默认视为检测通过
- livenessProbe:检测容器是否存活,如果存活探测失败,kubelet会杀死容器,是否重启会根据重启策略来定,如果没有配置存活探针,默认视为检测通过
- readnessProbe:检测容器是否能提供服务,如果检测失败,端点空机器将匹配pod的所有service的端点(Endpoint)删除该pod地址,pod的status下的ready也会变为false(不会重启pod)
- initialDelaySeconds:容器启动后要等待多少秒后猜启动存活和就绪探测器,默认是0秒,最小值是0
- periodSeconds:执行探测的时间间隔(单位是秒),默认是10秒,最小值1秒
- timeoutSeconds:探测的超时后等待多少秒,默认是1秒,最小值是1秒
- successThreshold:探测器在失败后的最小连续成功数,默认是1,存活和就绪探针这个值也只能为1
- failureThresnold:探测失效时,k8s的重试次数,对存活探针来说,探测失败意味着重启pod,对于就绪探针来说,探测失败意味着pod被打上未就绪标签,默认3次,最小1次
- postStart:pod创建后立即执行的检测,即不等待pod中的服务启动,如果postStart执行失败,pod不会继续创建
- preStop:在pod被停止之前执行
- 创建pod
- 完成调度
- 容器启动并执行postStart
- 探针检测(readness和liveness)容器进入running状态
- service关联pod
- 接收客户端请求
- 删除pod
- pod被设置为“Terminating”状态,从service的Endpoint里面中删除端点
- 执行preStop
- k8s想pod中的容器发送SIGTERM信号(正常终止信号)终止pod里面的主进程,这个信号让容器知道自己即将要被关闭(默认宽限30s,30秒内可以优雅的关闭)
- 默认的30s内关闭或者30s后发送信号SIGKILL到Pod,并删除Pod