Pod控制器
Pod控制器及其功用
Pod控制器,又称之为工作负载(workload),是用于实现管理pod的中间层,确保pod资源符合预期的状态,pod的资源出现故障时,会尝试进行重启,当根据重启策略无效,则会重新新建pod的资源。
pod控制器有多种类型
1、ReplicaSet: 代用户创建指定数量的pod副本,确保pod副本数量符合预期状态,并且支持滚动式自动扩容和缩容功能。 ReplicaSet主要三个组件组成: (1)用户期望的pod副本数量 (2)标签选择器,判断哪个pod归自己管理 (3)当现存的pod数量不足,会根据pod资源模板进行新建 帮助用户管理无状态的pod资源,精确反应用户定义的目标数量,但是RelicaSet不是直接使用的控制器,而是使用Deployment。 2、Deployment:工作在ReplicaSet之上,用于管理无状态应用,目前来说最好的控制器。支持滚动更新和回滚功能,还提供声明式配置。 ReplicaSet 与Deployment 这两个资源对象逐步替换之前RC的作用。 3、DaemonSet:用于确保集群中的每一个节点只运行特定的pod副本,通常用于实现系统级后台任务。比如ELK服务 特性:服务是无状态的 服务必须是守护进程 4、StatefulSet:管理有状态应用 5、Job:只要完成就立即退出,不需要重启或重建 6、Cronjob:周期性任务控制,不需要持续后台运行
Pod与控制器之间的关系
controllers:在集群上管理和运行容器的 pod 对象, pod 通过 label-selector 相关联。 Pod 通过控制器实现应用的运维,如伸缩,升级等。
Deployment
部署无状态应用
管理Pod和ReplicaSet
具有上线部署、副本设定、滚动升级、回滚等功能
提供声明式更新,例如只更新一个新的image
应用场景:web服务
apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deployment labels: app: nginx spec: replicas: 3 selector: matchLabels: app: nginx template: metadata: labels: app: nginx spec: containers: - name: nginx image: nginx:1.15.4 ports: - containerPort: 80
kubectl get pods,deploy,rs
kubectl edit deployment.apps/nginx-deployment
kubectl rollout history deployment/nginx-deployment
SatefulSet
部署有状态应用
稳定的持久化存储,即Pod重新调度后还是能访问到相同的持久化数据,基于PVC来实现
稳定的网络标志,即Pod重新调度后其PodName和HostName不变,基于Headless Service(即没有Cluster IP的Service)来实现
有序部署,有序扩展,即Pod是有顺序的,在部署或者扩展的时候要依据定义的顺序依次进行(即从0到N-1,在下一个Pod运行之前所有之前的Pod必须都是Running和Ready状态),基于init containers来实现
有序收缩,有序删除(即从N-1到0
常见的应用场景:数据库
https://kubernetes.io/docs/concepts/workloads/controllers/statefulset/
apiVersion: v1 kind: Service metadata: name: nginx
namespace: hanbao labels: app: nginx spec: ports: - port: 80 name: web clusterIP: None selector: app: nginx --- apiVersion: apps/v1 kind: StatefulSet metadata: name: web
namespace: hanbao spec: selector: matchLabels: app: nginx # has to match .spec.template.metadata.labels serviceName: "nginx" replicas: 3 # by default is 1 template: metadata: labels: app: nginx # has to match .spec.selector.matchLabels spec: terminationGracePeriodSeconds: 10 containers: - name: nginx image: soscscs/myapp:v1 ports: - containerPort: 80 name: web volumeMounts: - name: www mountPath: /usr/share/nginx/html volumeClaimTemplates: - metadata: name: www spec: accessModes: [ "ReadWriteOnce" ] storageClassName: "nfs-client-storageclass" resources: requests: storage: 1Gi
从上面的应用场景可以发现,StatefulSet由以下几个部分组成: ●Headless Service(无头服务):用于为Pod资源标识符生成可解析的DNS记录。 ●volumeClaimTemplates(存储卷申请模板):基于静态或动态PV供给方式为Pod资源提供专有的固定存储。 ●StatefulSet:用于管控Pod资源。 为什么要有headless? 在deployment中,每一个pod是没有名称,是随机字符串,是无序的。而statefulset中是要求有序的,每一个pod的名称必须是固定的。当节点挂了,重建之后的标识符是不变的,每一个节点的节点名称是不能改变的。pod名称是作为pod识别的唯一标识符,必须保证其标识符的稳定并且唯一。 为了实现标识符的稳定,这时候就需要一个headless service 解析直达到pod,还需要给pod配置一个唯一的名称。 为什么要有volumeClaimTemplate? 大部分有状态副本集都会用到持久存储,比如分布式系统来说,由于数据是不一样的,每个节点都需要自己专用的存储节点。而在 deployment中pod模板中创建的存储卷是一个共享的存储卷,多个pod使用同一个存储卷,而statefulset定义中的每一个pod都不能使用同一个存储卷,由此基于pod模板创建pod是不适应的,这就需要引入volumeClaimTemplate,当在使用statefulset创建pod时,会自动生成一个PVC,从而请求绑定一个PV,从而有自己专用的存储卷。 服务发现:就是应用服务之间相互定位的过程。 应用场景: ●动态性强:Pod会飘到别的node节点 ●更新发布频繁:互联网思维小步快跑,先实现再优化,老板永远是先上线再慢慢优化,先把idea变成产品挣到钱然后再慢慢一点一点优化 ●支持自动伸缩:一来大促,肯定是要扩容多个副本 K8S里服务发现的方式---DNS,使K8S集群能够自动关联Service资源的“名称”和“CLUSTER-IP”,从而达到服务被集群自动发现的目的。 实现K8S里DNS功能的插件: ●skyDNS:Kubernetes 1.3之前的版本 ●kubeDNS:Kubernetes 1.3至Kubernetes 1.11 ●CoreDNS:Kubernetes 1.11开始至今
apiVersion: v1 kind: Pod metadata: name: dns-test spec: containers: - name: busybox image: busybox:1.28.4 args: - /bin/sh - -c - sleep 36000 restartPolicy: Never
#查看statefulset的定义
kubectl explain statefulset
kubectl explain statefulset.spec
清单定义StatefulSet
如上所述,一个完整的 StatefulSet 控制器由一个 Headless Service、一个 StatefulSet 和一个 volumeClaimTemplate 组成。如下资源清单中的定义
apiVersion: v1 kind: Service metadata: labels: app: mysvc name: mysvc namespace: hanbao spec: selector: app: myapp type: ClusterIP clusterIP: None --- apiVersion: apps/v1 kind: StatefulSet metadata: labels: app: sts01 name: sts01 namespace: hanbao spec: serviceName: mysvc replicas: 2 selector: matchLabels: app: myapp template: metadata: labels: app: myapp spec: containers: - image: soscscs/myapp:v1 name: nginx ports: - containerPort: 80 volumeMounts: - name: www mountPath: /usr/share/nginx/html volumeClaimTemplates: - metadata: name: www spec: accessModes: [ "ReadWriteOnce" ] storageClassName: "nfs-client-storageclass" resources: requests: storage: 1Gi
解析上例:由于 StatefulSet 资源依赖于一个实现存在的 Headless 类型的 Service 资源,所以需要先定义一个名为 myapp-svc 的 Headless Service 资源,用于为关联到每个 Pod 资源创建 DNS 资源记录。接着定义了一个名为 myapp 的 StatefulSet 资源,它通过 Pod 模板创建了 3 个 Pod 资源副本,并基于 volumeClaimTemplates 向前面创建的PV进行了请求大小为 2Gi 的专用存储卷。
定义PV
apiVersion: v1 kind: PersistentVolume metadata: name: pv002 labels: name: pv002 spec: nfs: path: /data/volumes/v2 server: 192.168.19.19 accessModes: ["ReadWriteOnce"] capacity: storage: 2Gi --- apiVersion: v1 kind: PersistentVolume metadata: name: pv003 labels: name: pv003 spec: nfs: path: /data/volumes/v3 server: 192.168.19.19 accessModes: ["ReadWriteMany","ReadWriteOnce"] capacity: storage: 2Gi --- apiVersion: v1 kind: PersistentVolume metadata: name: pv004 labels: name: pv004 spec: nfs: path: /data/volumes/v4 server: 192.168.19.19 accessModes: ["ReadWriteMany","ReadWriteOnce"] capacity: storage: 2Gi --- apiVersion: v1 kind: PersistentVolume metadata: name: pv005 labels: name: pv005 spec: nfs: path: /data/volumes/v5 server: 192.168.19.19 accessModes: ["ReadWriteMany","ReadWriteOnce"] capacity: storage: 2Gi
验证数据持久化
#删除后重建,poc名称不会该
#数据还是会一直存在
验证扩容的创建过程是升序串行执行,并且自动创建pv
kubectl edit -n hanbao statefulsets.apps sts01
#扩容 会根据现有的名称,继续创建新的Pod,有序执行,并且为串行
验证滚动更新的时候也是升序执行,数据持久化还在
kubectl -n hanbao set image statefulset sts01 nginx=soscscs/myapp:v2
#倒序执行,pod的IP会变,但是Pod的名称始终不变
滚动更新为先删除1个pod 然后再创建一个新的pod
滚动更新后,数据还在
验证缩容的时候是倒序执行
kubectl -n hanbao scale statefulset sts01 --replicas=2
#缩容,倒序删除Pod
#缩容时候PV和PVC不会删除
statefulset的特点
1、statefulset用于部署有状态的应用(有实时数据需要存储的应用) 2、部署statefulset之前,需要先创建一个headless service(表示clusterip为node的特殊service类型),statefulset的配置清单模板需要去指定servicename为headless service的名称。 3、statefulset创建的pod名称是固定不变的,且唯一的 4、statefulset的资源配置模板可以设置pvc模板,指定storageclassname字段值,可以引用storageclass资源,调用存储卷插件,动态创建pv 5、statefulset管理的pod有滚动更新和扩容和缩容功能,扩容的时候为升序执行,滚动更新和缩容的时候为降序执行。 6、statefulset管理的pod可以在k8s集群的pod中,基于headless service以及coredns实现对pod名称解析出podIP
DaemonSet
DaemonSet 确保全部(或者一些)Node 上运行一个 Pod 的副本。当有 Node 加入集群时,也会为他们新增一个 Pod 。当有 Node 从集群移除时,这些 Pod 也会被回收。删除 DaemonSet 将会删除它创建的所有 Pod。 使用 DaemonSet 的一些典型用法: ●运行集群存储 daemon,例如在每个 Node 上运行 glusterd、ceph。 ●在每个 Node 上运行日志收集 daemon,例如fluentd、logstash。 ●在每个 Node 上运行监控 daemon,例如 Prometheus Node Exporter、collectd、Datadog 代理、New Relic 代理,或 Ganglia gmond。 应用场景:Agent
//官方案例(监控)
https://kubernetes.io/docs/concepts/workloads/controllers/daemonset/
vim ds.yaml apiVersion: apps/v1 kind: DaemonSet metadata: name: nginx-daemonSet labels: app: nginx spec: selector: matchLabels: app: nginx template: metadata: labels: app: nginx spec: containers: - name: nginx image: nginx:1.15.4 ports: - containerPort: 80 kubectl apply -f ds.yaml
//DaemonSet会在每个node节点都创建一个Pod
kubectl get pods
nginx-deployment-4kr6h 1/1 Running 0 35s
nginx-deployment-8jrg5 1/1 Running 0 35s
Job
Job分为普通任务(Job)和定时任务(CronJob) 常用于运行那些仅需要执行一次的任务 应用场景:数据库迁移、批处理脚本、kube-bench扫描、离线数据处理,视频解码等业务 https://kubernetes.io/docs/concepts/workloads/controllers/jobs-run-to-completion/
示例: vim job.yaml apiVersion: batch/v1 kind: Job metadata: name: pi spec: template: spec: containers: - name: pi image: perl command: ["perl", "-Mbignum=bpi", "-wle", "print bpi(2000)"] restartPolicy: Never backoffLimit: 4 //参数解释 .spec.template.spec.restartPolicy该属性拥有三个候选值:OnFailure,Never和Always。默认值为Always。它主要用于描述Pod内容器的重启策略。在Job中只能将此属性设置为OnFailure或Never,否则Job将不间断运行。 .spec.backoffLimit用于设置job失败后进行重试的次数,默认值为6。默认情况下,除非Pod失败或容器异常退出,Job任务将不间断的重试,此时Job遵循 .spec.backoffLimit上述说明。一旦.spec.backoffLimit达到,作业将被标记为失败。 //在所有node节点下载perl镜像,因为镜像比较大,所以建议提前下载好 docker pull perl kubectl apply -f job.yaml kubectl get pods pi-bqtf7 0/1 Completed 0 41s //结果输出到控制台 kubectl logs pi-bqtf7 3.14159265...... //清除job资源 kubectl delete -f job.yaml //backoffLimit vim job-limit.yaml apiVersion: batch/v1 kind: Job metadata: name: busybox spec: template: spec: containers: - name: busybox image: busybox imagePullPolicy: IfNotPresent command: ["/bin/sh", "-c", "sleep 10;date;exit 1"] restartPolicy: Never backoffLimit: 2 kubectl apply -f job-limit.yaml kubectl get job,pods NAME COMPLETIONS DURATION AGE job.batch/busybox 0/1 4m34s 4m34s NAME READY STATUS RESTARTS AGE pod/busybox-dhrkt 0/1 Error 0 4m34s pod/busybox-kcx46 0/1 Error 0 4m pod/busybox-tlk48 0/1 Error 0 4m21s kubectl describe job busybox ...... Warning BackoffLimitExceeded 43s job-controller Job has reached the specified backoff limit
CronJob
周期性任务,像Linux的Crontab一样。
周期性任务
应用场景:通知,备份
https://kubernetes.io/docs/tasks/job/automated-tasks-with-cron-jobs/
每分钟打印hello vim cronjob.yaml apiVersion: batch/v1beta1 kind: CronJob metadata: name: hello spec: schedule: "*/1 * * * *" jobTemplate: spec: template: spec: containers: - name: hello image: busybox imagePullPolicy: IfNotPresent args: - /bin/sh - -c - date; echo Hello from the Kubernetes cluster restartPolicy: OnFailure //cronjob其它可用参数的配置 spec: concurrencyPolicy: Allow #声明了 CronJob 创建的任务执行时发生重叠如何处理(并发性规则仅适用于相同 CronJob 创建的任务)。spec仅能声明下列规则中的一种: ●Allow (默认):CronJob 允许并发任务执行。 ●Forbid:CronJob 不允许并发任务执行;如果新任务的执行时间到了而老任务没有执行完,CronJob 会忽略新任务的执行。 ●Replace:如果新任务的执行时间到了而老任务没有执行完,CronJob 会用新任务替换当前正在运行的任务。 startingDeadlineSeconds: 15 #它表示任务如果由于某种原因错过了调度时间,开始该任务的截止时间的秒数。过了截止时间,CronJob 就不会开始任务,且标记失败.如果此字段未设置,那任务就没有最后期限。 successfulJobsHistoryLimit: 3 #要保留的成功完成的任务数(默认为3) failedJobsHistoryLimit:1 #要保留多少已完成和失败的任务数(默认为1) suspend:true #如果设置为 true ,后续发生的执行都会被挂起。 这个设置对已经开始的执行不起作用。默认是 false。 schedule: '*/1 * * * *' #必需字段,作业时间表。在此示例中,作业将每分钟运行一次 jobTemplate: #必需字段,作业模板。这类似于工作示例
kubectl create -f cronjob.yaml
kubectl get cronjob
NAME SCHEDULE SUSPEND ACTIVE LAST SCHEDULE AGE
hello */1 * * * * False 0 <none> 25s
kubectl get pods
NAME READY STATUS RESTARTS AGE
hello-1621587180-mffj6 0/1 Completed 0 3m
hello-1621587240-g68w4 0/1 Completed 0 2m
hello-1621587300-vmkqg 0/1 Completed 0 60s
kubectl logs hello-1621587180-mffj6
Fri May 21 09:03:14 UTC 2021
Hello from the Kubernetes cluster
//如果报错:Error from server (Forbidden): Forbidden (user=system:anonymous, verb=get, resource=nodes, subresource=proxy) ( pods/log hello-1621587780-c7v54)
//解决办法:绑定一个cluster-admin的权限
kubectl create clusterrolebinding system:anonymous --clusterrole=cluster-admin --user=system:anonymous
总结
#Pod控制器 1)Deployment + ReplicaSet 部署无状态应用(没有实时的数据需要存储) 负责创建和管理RepliacSet,维护Pod副本数与预期值保持一致 负责创建和删除控制器管理的Pod资源,有多个Pod副本时是并行创建启动的,升级策略默认为滚动更新的方式 2)StatefulSet 功能: 部署有状态应用(有实时的数据需要存储) 特性: 每个Pod名称标识都是唯一且固定不变的 每个Pod都可以有自己专属的持久化存储(基于PVC模板volumeClaimTemplates实现的) 需要提前创建一个Headless Service资源(无头服务,ClusterIP为Node的service资源),并在StatefulSet资源配置中使用serviceName字段指定Headless Service资源名称 可以在K8S集群的Pod中通过<Pod名称>.<service名称>.<命名空间>格式解析出StatefulSet控制器管理的Pod资源的PodIP(基于Headless Service和CoreDNS实现的) 创建、滚动升级、扩容、缩容Pod副本时都是有序进行的(由spec.PodManagementPolicy字段决定的,默认为OrderedReady,如果设置为Paralle1则并行的管理Pod) 创建、扩容是升序进行的(顺序为Pod标识号从0到n-1) 滚动升级、缩容是倒序执行的(顺序为Pod标识号从n-1到0) Service资源的类型:4个常规类型(ClusterIP NodePort LoadBalancer ExternalName) + 1个特殊类型(Headless Service) 3)DaemonSet 通常用于部署daemon(守护进程)级别的无状态应用 理论上可在K8S集群所有node节点上都创建一个相同的Pod副本,无论node节点何时加入到K8S集群(需要考虑到污点taint和cordon不可调度的影响) DaemonSet资源配置不需要设置Pod副本数字段replicas 4)Job 部署一次性的短期任务的Pod资源,Pod不会持续运行,并要求任务执行完毕后容器成功退出且不再重启。 Job资源配置的容器重启策略要求不能设置为Always,一般推荐设置为Never 如果任务执行失败导致Pod容器异常退出,那么Job会根据backoffLimit字段的值决定重建Pod来重试任务的次数(默认为6) 5)Cronjob 部署周期性的短期任务的Pod资源,Pod不会持续运行,并要求任务执行完毕后容器成功退出且不再重启。 Pod容器重启策略要求不能设置为Always,一般推荐设置为Never 要配置schedule字段设置任务执行的周期表,格式为"分 时 日 月 周"
标签:控制器,name,spec,nginx,Pod,K8S,pod,metadata From: https://www.cnblogs.com/yanrui07/p/18057920