ceph存储osd启动异常处理和正常启停操作

时间：2023-06-21 15:04:20浏览次数：36

标签：1.00000 osd.11 3.64000 haha1 up ceph 启停 osd

机器角色：cloudstack虚拟机的宿主机；ceph存储机器。

事件：ceph存储的物理机器由于内存异常，需要停机更换，仅仅是把该物理机上面的虚拟机迁移走，同时启动了停机维护，然后就直接关机。结果造成重启之后ceph异常

原因：由于异常关闭，ceph进程的相关信息没有正常关闭，信息没有同步到文件系统，如pid文件等信息

现象并尝试解决：

1）检查osd的整体信息

[root@haha1~]# ceph osd tree

ID WEIGHT TYPE NAME UP/DOWN REWEIGHT PRIMARY-AFFINITY

-1 101.91998 root default

-2 25.48000 host haha-50

1 3.64000 osd.1 up 1.00000 1.00000

2 3.64000 osd.2 up 1.00000 1.00000

3 3.64000 osd.3 up 1.00000 1.00000

4 3.64000 osd.4 up 1.00000 1.00000

5 3.64000 osd.5 up 1.00000 1.00000

6 3.64000 osd.6 up 1.00000 1.00000

0 3.64000 osd.0 up 1.00000 1.00000

-3 25.48000 host XKDHhost1-51

7 3.64000 osd.7 up 1.00000 1.00000

9 3.64000 osd.9 up 1.00000 1.00000

10 3.64000 osd.10 down 0 1.00000

11 3.64000 osd.11 down 0 1.00000

12 3.64000 osd.12 up 1.00000 1.00000

13 3.64000 osd.13 up 1.00000 1.00000

2）osd显示的是down，但是通过

[root@haha1 ~]# /etc/init.d/ceph status osd.11

=== osd.11 ===

osd.11: running {"version":"0.94.2"}

3）重启osd.11尝试解决

[root@haha1 ~]# /etc/init.d/ceph restart osd.11

=== osd.11 ===

Stopping Ceph osd.11 on haha1...kill 7330...kill 7330...done #有kill，可以正常重启

=== osd.11 ===

create-or-move updated item name 'osd.11' weight 3.64 at location {host=XKDHhost1-51,root=default} to crush map

Starting Ceph osd.11 on haha1...

Running as unit run-35058.service.

4）osd.10启动异常

[root@haha1 ~]# /etc/init.d/ceph start osd.10

=== osd.10 ===

create-or-move updated item name 'osd.10' weight 3.64 at location {host=haha1,root=default} to crush map

Starting Ceph osd.10 on haha1...

Running as unit run-36525.service.

[root@haha1 ~]# /etc/init.d/ceph status osd.10

=== osd.10 ===

osd.10: not running.

s=a>create-or-move updated item name 'osd.11' weight 3.64 at location {root=default} to crush map

Starting Ceph osd.11 on haha1...

Running as unit run-35058.service.

用一个例子来演示会更加清晰

标签：1.00000,osd.11,3.64000,haha1,up,ceph,启停,osd
From： https://blog.51cto.com/u_13747193/6528524

ceph删除fsid
ceph重装后，fsid冲突，导致重启后mon节点丢了一个查看容器服务，发现丢了一个mon服务 grepfsid/etc/ceph/ceph.confls/var/lib/cephcephadmrm-cluster--fsid$FSID--forcesystemctlrestartceph-$FSID@mon.controller3.service 此时其他fsid的容器服务一下子......
shell启停脚本
#!/usr/bin/envbash#获取服务目录xxx_dir=$(cd$(dirname"${BASH_SOURCE[0]}")&&pwd)#端口检测间隔w_interval=3#启动后端口检测次数max_retried_times=50REDIS_INSTALL_DIR=/bin/REDIS_CONFIG_FILE=/etc/redis/redis.confMONGO_INSTALL_DIR=/usr/MONGO_CON......
ros melodic安装，rosdep init失败解决方法
1.背景：前段时间手贱把之前安装好的ros环境给删了，这两天刚好需要用，遇到了点之前踩过的坑，主要是众所周知的rosdepinit失败，这里记录一下。2.系统：Ubuntu18.043.网络环境：有魔法3.需求：安装rosmelodic版本4.安装步骤：a.基本流程都可以按照官方的进行，贴上链接：http://wiki.ro......
ceph集群部署（自用）
<准备工作>一、配置主机名A、配置主机节点Ceph1节点：hostnamectl--staticset-hostnameceph1其余节点以此类推。B、修改域名解析文件：vim/etc/hosts在各个集群和客户端节点的“/etc/hosts”中添加如下内容：192.168.58.240ceph1192.168.58.200ceph2192.168.58.50ceph3二......
PROXMOX及CEPH笔记2
1、关于物理磁盘服务器有硬件阵列卡并且卡上有电池和缓存，一定要为每个VirtralDisk打开WriteBack和Readahead，如有有Cache也打开2、提高CEPH修复的速度，这个我觉得也挺重要的，保证资料完整性https://www.modb.pro/db/220671在任一节点上运行：cephtellosd.*injectargs--osd_......
Qt编写onvif工具(搜索/云台/预置位/OSD/录像存储)
一、前言从最初编写这个工具开始的时间算起来，至少5年多，一直持续完善到今天，这个工具看起来小也不小大也不大，但是也是经历过无数个现场的洗礼，毫不夸张的说，市面上能够遇到的主流的厂商的设备，都测试过，而且做过大量设备的测试，并不是调试个一个两个的，也并不是在实验室环境中搞开发的，而......
PROXMOX创建CEPH笔记
1、准备工作集群内各主机一定要先做校时，保证各节点时间一致，要么安装ntpdate，要么安装chrony（建议使用这个，实现自动校时）可参考文章： https://blog.csdn.net/wylfengyujiancheng/article/details/88298708 https://blog.csdn.net/m0_47476627/article/details/1260037912、创......
[TSG开发日志2]串口通信？VS下FaroSDK编译环境？一文搞定
艹，不知道为什么我之前写的法如sdk没有保存，总而言之就是莫名其妙整个工程没有了，后来我想了想，也有可能就是我自己删掉了，因为在配置法如工程的时候遇到了一些小问题，不过现在也解决了。一、关于串口通信：Qt的确有自己的串口通信类，就是QSerialPort，但是我们在使用过程中因为要更加定制......
ruby 访问 ceph
#!/usr/bin/envruby#通过restfulAPIrequire"base64"require"openssl"require"net/http"PublicKey="publicKey"PrivateKey="privateKey"defgen_auth(http_method,bucket,filename,gmttime)sign=......
Intermediate-用rosdep来管理依赖
目标：使用rosdep来管理外部的依赖什么是rosdep？rosdep是ROS的依赖管理实用程序，可以与ROS包和外部库一起使用。rosdep是一个命令行实用程序，用于识别和安装依赖项以构建或安装包。在以下情况下可以调用或被调用：1）构建一个工作区，并需要适当的依赖项来构建内的包。2）安装软件包（例如sud......

ceph存储osd启动异常处理和正常启停操作

相关文章

赞助商

阅读排行