首页 > 其他分享 >ks8遇到的问题处理

ks8遇到的问题处理

时间:2024-12-29 09:45:09浏览次数:5  
标签:master1 遇到 处理 ks8 192.168 Terminating docker k8s node3

1、k8s节点其中一个节点宕机了,怎么处理?

参考:k8s节点宕机之后怎么办_wx6059ab850845f的技术博客_51CTO博客

 里面正在运行的pod挂掉了,虽然会切换到其他节点,但是这个Terminating 会一直显示挂在首页。(重启node主机就可以解决,但是机器已经挂了,无法操作?)

结合生成环境,一般机器常规性宕机,需要进行硬件维护,所以不涉及到主机替换。操作方法如下,

[root@k8s-master1 ~]# kubectl get pods -A -owide|grep Terminating
default       myapp                                      1/1     Terminating             1          21h   192.168.107.195   k8s-node3     <none>           <none>
devs          myapptdep1-b88d8b45f-fnpdb                 1/1     Terminating             0          15h   192.168.107.204   k8s-node3     <none>           <none>
[root@k8s-master1 ~]# 
[root@k8s-master1 ~]# kubectl get nodes -owide
NAME          STATUS     ROLES    AGE   VERSION   INTERNAL-IP     EXTERNAL-IP   OS-IMAGE                KERNEL-VERSION                 CONTAINER-RUNTIME
k8s-master1   Ready      master   12d   v1.14.3   192.168.1.131   <none>        CentOS Linux 7 (Core)   3.10.0-1160.119.1.el7.x86_64   docker://19.3.13
k8s-master2   Ready      master   12d   v1.14.3   192.168.1.132   <none>        CentOS Linux 7 (Core)   3.10.0-1160.119.1.el7.x86_64   docker://19.3.13
...
k8s-node3     NotReady   <none>   12d   v1.14.3   192.168.1.136   <none>        CentOS Linux 7 (Core)   3.10.0-1160.119.1.el7.x86_64   docker://19.3.13
[root@k8s-master1 ~]# kubectl get pods -A -owide|grep Terminating
default       myapp                                      1/1     Terminating             1          21h   192.168.107.195   k8s-node3     <none>           <none>
devs          myapptdep1-b88d8b45f-fnpdb                 1/1     Terminating             0          15h   192.168.107.204   k8s-node3     <none>           <none>
[root@k8s-master1 ~]# kubectl cordon k8s-node3
node/k8s-node3 cordoned
[root@k8s-master1 ~]# kubectl drain k8s-node3 --ignore-daemonsets --force
node/k8s-node3 already cordoned
WARNING: deleting Pods not managed by ReplicationController, ReplicaSet, Job, DaemonSet or StatefulSet: default/myapp; ignoring DaemonSet-managed Pods: kube-system/calico-node-hn8ks, kube-system/kube-proxy-hlkwm
evicting pod "myapptdep1-b88d8b45f-fnpdb"
evicting pod "myapp"
^C
[root@k8s-master1 ~]# kubectl get nodes -owide                           
NAME          STATUS                        ROLES    AGE   VERSION   INTERNAL-IP     EXTERNAL-IP   OS-IMAGE                KERNEL-VERSION                 CONTAINER-RUNTIME
...
k8s-node2     Ready                         <none>   12d   v1.14.3   192.168.1.135   <none>        CentOS Linux 7 (Core)   3.10.0-1160.119.1.el7.x86_64   docker://19.3.13
k8s-node3     NotReady,SchedulingDisabled   <none>   12d   v1.14.3   192.168.1.136   <none>        CentOS Linux 7 (Core)   3.10.0-1160.119.1.el7.x86_64   docker://19.3.13

先执行cordon标记为不可调度,防止新的pod被调度过来,再次执行drain驱逐,将节点上面的pod迁移到新的节点。待机器维护完成,cordon标记为可调度即可。

这里至于Terminating pod,为了不影响使用,可以选择直接删除了。也可以等机器恢复后,自动删除。

[root@k8s-master1 ~]# kubectl -n devs delete pod myapptdep1-b88d8b45f-fnpdb --grace-period=0 --force    # 直接删除可以会删不掉,要接参数。

 

2、k8s升级?

3、weave 版本选择

 4、亲和性和容忍度

5、网络插件weave

 下载容器镜像

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/weaveworks/weave-kube:2.8.1
docker tag swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/weaveworks/weave-kube:2.8.1 netcorecore/weave-kube:v2.8.1
docker pull netcorecore/weave-npc:v2.8.1

每个节点都需要这两个镜像(含master和node)

部署网络插件到集群

wget http://static.corecore.cn/weave.v2.8.1.yaml

kubectl apply -f weave.v2.8.1.yaml
kubectl get pods -n kube-system |grep weav
weave-net-ctt2w 2/2 Running 0 28m
weave-net-jbpjw 2/2 Running 1 28m
weave-net-vq545 2/2 Running 0 28m
kubectl get nodes
NAME STATUS ROLES AGE VERSION
k8smaster Ready master 117m v1.18.0
k8snode1 Ready <none> 113m v1.18.0
k8snode2 Ready <none> 113m v1.18.0复制代码

======

标签:master1,遇到,处理,ks8,192.168,Terminating,docker,k8s,node3
From: https://www.cnblogs.com/sunnyyangwang/p/18573141

相关文章

  • Go基础之条件语句,For循环,错误处理
    目录1条件语句1.1if语句1.2switch1.2.1switch1.2.2TypeSwitch1.2.3fallthrough2for循环2.1简介2.2For-eachrange循环2.3示例3错误处理3.1简介3.2error接口3.2.1error接口3.2.2使用errors包创建错误3.2.3errors包原理3.3显式返回错误3.4自定义错误3.4.1......
  • Go IO之文件处理,TCP&UDP讲解
    目录1文件处理1.1打开和关闭文件1.2读取文件1.2.1简单示例1.2.2中文乱码1.2.2.1bufio1.2.2.2ioutil1.3写入文件1.3.1Write和WriteString1.3.2fmt.Fprintln1.3.2.1写入文件1.3.2.2写入标准输出1.3.3bufio.NewWriter1.3.4ioutil.WriteFile2TCP&UDP2.1TCP2.1.1服......
  • 如何处理宝塔面板无法新建站点的问题?
    您好,当您在宝塔面板中遇到无法新建站点的问题时,可以按照以下步骤进行排查和解决:检查面板版本:确认您使用的宝塔面板版本是否为最新版本。旧版本可能存在一些已知的Bug,导致无法正常创建站点。建议您定期更新宝塔面板至最新版本,以确保所有功能都能正常工作。检查系统资源:......
  • 如何处理建站助手建完站后无法访问网站的问题?
    您好,当您使用建站助手完成网站建设后,如果遇到无法访问网站的情况,可以按照以下步骤进行排查和解决:确认域名解析:首先,检查域名是否正确解析到服务器的IP地址。您可以通过在线DNS查询工具(如(网址))来验证域名解析是否正确。如果解析有问题,请联系域名注册商进行修正。检查服务......
  • 网站被挂马,如何处理?
    网站被挂马后,您希望能够尽快清理并防止再次发生。这类问题可能由以下几个原因引起:木马文件植入:黑客可能通过漏洞植入了木马文件,导致网站被挂马。建议您立即删除所有可疑文件,并进行全面扫描。可以使用专业的杀毒软件或在线扫描工具(如SucuriSiteCheck)检查网站文件。数据库注......
  • 信号特征提取及处理/FFT实现/FFT和IFFT(MATLAB)/含噪声信号频域简单幅值阈值处理/频谱
            传统的离散傅里叶变换(DFT)虽然能够实现时域到频域的转换,但计算复杂度极高,对于大规模数据的处理效率十分低下。直到快速傅里叶变换(FFT)算法的出现,才极大地改变了这一局面。FFT算法利用了信号的对称性和周期性等特性,将DFT的计算复杂度从原本的  大幅降低到 ,......
  • [开源]用QT+OPENCV做了一个图片处理软件
    yusongmin1/QT_OPENCV界面如下基本功能,基本上没有基于opencv的库函数,手搓关于常见的传统图片处理的算法的开发,包括了内置图片,图片加载与保存,图片变换GRB2GRAY,RGB2HSV镜像,水平镜像,垂直镜像,负90度到正90度之间的旋转,阈值分割,反向腐蚀膨胀,开运算闭运算直方图......
  • PhpStorm 2024.3完整版的安装教程(附激活,常见问题处理)
    卸载老版本PhpStorm首先,如果小伙伴的电脑上有安装老版本的PhpStorm,需要将其彻底卸载掉,如下所示(没有安装则不用管,直接安装即可):TIP:如果你之前使用过本站提供的 激活到2025年版本脚本,需要执行对应卸载脚本/适用2024版本/JetBrains2023最新全家桶/jetbra/scripts/unin......
  • 使用 `hash-wasm` 的 `createMD5`方法,生成md5值,批处理500张图片会报错, `RangeError: W
    处理大量文件时遇到RangeError:WebAssembly.instantiate():Outofmemory错误,通常是因为一次性创建了过多的WebAssembly实例,导致内存不足。每个createMD5()调用都会创建一个新的WebAssembly实例,这对于大量的并发操作来说是不可行的。为了优化代码并避免此问题,可以考虑......
  • Python读取栅格图像并对像元数据处理后导出到表格文件中
      本文介绍基于Python语言中的gdal模块,读取一景.tif格式的栅格遥感影像文件,提取其中每一个像元的像素数值,对像素值加以计算(辐射定标)后,再以一列数据的形式将计算后的各像元像素数据保存在一个.csv格式文件中的方法。  首先,我们明确一下本文的需求。现在有一个栅格遥感影像文件......