首页 > 其他分享 >k8s集群无法启动

k8s集群无法启动

时间:2024-02-22 13:55:08浏览次数:27  
标签:11 node 启动 980 40 kubelet 集群 test k8s

K8S集群启动失败

一、问题现象

问题的起因:来源于大年初二的停电
上班后第一天:开始重启所有服务,就发现了k8s集群无法启动了。。
[root@test ~]# kubectl get nodes
The connection to the server 10.0.7.16:6443 was refused - did you specify the right host or port?

二、解决思路


###查看kubelet的状态
[root@test ~]# systemctl status kubelet.service
● kubelet.service - kubelet: The Kubernetes Node Agent
   Loaded: loaded (/usr/lib/systemd/system/kubelet.service; enabled; vendor preset: disabled)
  Drop-In: /usr/lib/systemd/system/kubelet.service.d
           └─10-kubeadm.conf
   Active: active (running) since 一 2024-02-12 08:47:31 CST; 5 days ago
     Docs: https://kubernetes.io/docs/
 Main PID: 980 (kubelet)
   CGroup: /system.slice/kubelet.service
           └─980 /usr/bin/kubelet --bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf --config=/var/lib/kubelet/con...

###查看日志
2月 17 11:40:30 test kubelet[980]: E0217 11:40:30.760521     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:30 test kubelet[980]: E0217 11:40:30.861049     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:30 test kubelet[980]: E0217 11:40:30.961809     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.062716     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.163402     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.264104     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.364707     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.465786     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.566598     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
2月 17 11:40:31 test kubelet[980]: E0217 11:40:31.667122     980 kubelet.go:2291] "Error getting node" err="node \"test\" not found"
###查看防火墙
[root@test ~]# systemctl status firewalld.service
● firewalld.service - firewalld - dynamic firewall daemon
   Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
   Active: inactive (dead)
     Docs: man:firewalld(1)

###最后在日志里发现下面这段的错误,提示证书过期了。。。。由于这套集群是之前同事搭建的,未做记录,故不知。。又碰巧遇到了这次停电
导致集群启动失败。
W0217 05:51:33.036279       1 clientconn.go:1223] grpc: addrConn.createTransport failed to connect to {https://127.0.0.1:2379   0 }. Err :connection error: desc = "transport: authentication handshake failed: x509: certificate has expired or is not yet valid: current time 2024-02-17T05:51:33Z is after 2024-01-12T09:25:13Z". Reconnecting...

###最后延长证书期限,并记录运维文档
https://blog.csdn.net/gotheon/article/details/133700695

标签:11,node,启动,980,40,kubelet,集群,test,k8s
From: https://www.cnblogs.com/world-of-yuan/p/18027174

相关文章

  • 八、启动引导
    八、启动引导1.linux的启动流程1.BIOS自检2.启动GRUB/LILO3.运行linuxkernel并检测硬件4.挂载根文件系统5.运行linux系统的第一个进程init(其PID永远为1,是所有其他进程的父进程)6.init读取系统引导配置文件/etc/inittab中的信息进行初始化7.执行系统初始化脚本--......
  • Windows10在启动时自动运行的应用
    Windows10在启动时自动运行的应用步骤:选择“开始”按钮,然后滚动查找你希望在启动时运行的应用。右键单击该应用,选择“更多”,然后选择“打开文件位置”。此操作会打开保存应用快捷方式的位置。如果没有“打开文件位置”选项,这意味着该应用无法在启动时运行。文件位置打......
  • Python启动其他程序
    通过python脚本来启动其他的程序,一般使用subprocessimportsubprocess#启动Windows上的计算机程序subprocess.Popen('C:\\Windows\\System32\\calc.exe')#启动记事本,并打开text.txt文件,在该列表中第一个元素表示程序名称,后面的都是参数subprocess.Popen(['C:\\Windows......
  • Kafka-批量启动和停止Kafka节点脚本
    1、编辑脚本#!/bin/bashzookeeper_home=/usr/local/zookeeperkafka_home=/usr/local/kafkazookeeper_array=(hadoop01hadoop02hadoop03)kafka_array=(hadoop01hadoop02hadoop03)##启动和停止Zookeeperfunctionzookeeper_operate(){zookeeper_operate=$@......
  • Zookeeper-批量启动和停止zookeeper节点脚本
    背景由于zookeeper的服务启动和停止,需要一台一台地去启动和停止。当部署的zookeeper节点多时非常麻烦,所以编写下面的脚本,用于提升启动和停止的效率。执行如下脚本需要确保:脚本存放的服务器与所有的zookeeper节点直接可以免密登录(服务器之间建立互信)。1、编辑脚本vi manage-z......
  • k8s-dashboard、helm
    目录dashboard安装dashboard1.创建SA2.集群角色绑定3.创建secret4.查看tokenhelm安装helm1.下载tar包2.解压3.配置环境变量4.配置helm补全配置helm源使用helm1.search2.pull3.执行安装3.1解压3.2将pv持久化存储关闭3.3安装3.4访问3.5获取登录的用户名和密码dashb......
  • mysql服务启动报错:本地计算机上的mysql服务启动后停止,某些服务在未由其他服务或程序启
    报错如下: 解决办法:1.开始->cmd->以管理员身份运行目录切换到C:\ProgramFiles\MySQL\MySQLServer5.7\bin2.运行mysqld--initialize-insecure--user=mysql说明:初始化后,root密码位空3.运行netstartmysql 三、修改mysql57的root密码[2]四、参考[1] mysql服务启......
  • UEFI方式启动EfiGuard
    BootingtheloaderDownloadEfiGuardandrename EFI/Boot/Loader.efi to bootx64.efi.PlacethefilesonabootdrivesuchasaFAT32formattedUSBstick(forphysicalmachines)oranISO/virtualdisk(forVMs).Assumingdrive X:,thepathsforthetwofi......
  • linux安装k8s 单机版
    一、准备工作1.确认环境swapoff-a//关闭swapsetenforce0//临时关闭selinux每台机器的ip和uuid不能一样cat/sys/class/dmi/id/product_uuid//每台机器的uuid不能相同ifconfig-a//ip不能相同2.开放端口协议方向端口范围作用使用者TCP......
  • hexo启动依赖问题,node npm版本过低
    调整:安装nvm工具,切换高一点版本,本例为v18.19.1。(安装示例的14.17未通过)做预先的升级工作:sudoaptupdatesudoaptupgradecurl-o-https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.0/install.sh|bash生效命令:source~/.bashrc查看版本:nvmls-remote删除npm缓存......