问题背景

某些 ceph 集群中，部分 osd 的 journal 指向的磁盘分区为设备名 + 分区编号的形式（例：/var/lib/ceph/osd/ceph-415/journal -> /dev/sdb1），部分服务器由于在运行过程中更换过磁盘，盘符发生变化，重启后，盘符可能再次变化， osd 无法正确找到对应的 journal 分区，导致 osd 启动失败。
由于分区的 partuuid 不会因为服务器重启发生变化，为了避免上述情况发生，此方案修改 osd 的 journal 分区指向到 partuuid（例：/var/lib/ceph/osd/ceph-14/journal -> /dev/disk/by-partuuid/0184594f-07eb-4c01-b06f-87c0a3873222）

适用版本

TStack 通用

操作影响

在停止和启动 osd 的过程中，可能出现短暂的慢请求。

解决方案

设置集群维护标记，避免在操作过程中，osd 被踢出集群

ceph osd set noout

查询当前 osd 的 journal 执行的设备分区，此处以 osd.423 为例

ls -la /var/lib/ceph/osd/ceph-423/journal
# 输出如下，即该 journal 指向的设备分区为 /dev/sdb1
# lrwxrwxrwx 1 ceph ceph 9 Oct 15  2019 /var/lib/ceph/osd/ceph-423/journal -> /dev/sdb1

查询该 journal 设备分区的 partuuid

ls -la /dev/disk/by-partuuid/ | grep sdb1
# 输出如下，即该设备分区的 uuid 为 78d7e10d-52b4-4519-9e2a-aa5a08c7ceb3
lrwxrwxrwx 1 root root  10 Oct 15  2019 78d7e10d-52b4-4519-9e2a-aa5a08c7ceb3 -> ../../sdb1

停止该 osd

# 在该 osd 所在节点执行
systemctl stop ceph-osd@423

删除旧的 journal 软链接

rm /var/lib/ceph/osd/ceph-423/journal

重新链接 journal 到 partuuid

ln -s /dev/disk/by-partuuid/78d7e10d-52b4-4519-9e2a-aa5a08c7ceb3 \ 
/var/lib/ceph/osd/ceph-423/journal

重新启动该 osd

systemctl start ceph-osd@423

如果有多个 osd 需要执行变更，在确保上一个 osd 操作完成，且 ceph 集群恢复健康之后，再重复执行步骤 2-7.

# 通过 ceph -s 观察集群状态，保证所有 pg 恢复为 active + clean
ceph -s

取消维护标志位

# 确保所有 osd 已恢复且集群状态健康的情况下执行
ceph osd unset noout

标签：journal,ceph,var,423,osd,partuuid
From： https://www.cnblogs.com/xuning-xuning/p/17350228.html

Ceph_osd_应急权重调整方案
目录1.问题背景2.操作影响3.适用版本4.操作范围5.操作周期6.操作步骤6.1查看当前osd数据状态6.2计算需要调整的osd权重6.3调整权重7.回退步骤1.问题背景集群pg数量规划不合理，导致在集群存入大量的数据之后，osd上的数据分布不均衡，部分osd的存储百分比接近或超......
PVE虚拟机出现系统启动报错“journalctl”to view system logst解决方法
故障现象虚拟机卡死，重启虚拟机后，不能正常进入系统解决办法xfsrepair-v-L/dev/dm-0L选项指定强制日志清零，强制xfs_repair将日志归零，即使它包含脏数据（元数据更改）。再重启下虚拟机即可......
SoSdp 学习笔记
SoSdp用来解决这种问题：对于非负整数\(i\)，\(K\)，定义布尔型二元运算\(i\subseteqK\)，可以以下四种等价角度理解：\(i\operatorname{bitand}K=i\)。\(\operatorname{bitand}\)是按位与的意思。同一个二进制位上，\(i\)的这一位小于等于\(K\)的这一位。同一个二进制位上，\(......
Frontiers of computer Science Journal 模版踩坑经历
官方模版提供网址如下：https://journal.hep.com.cn/fcs/EN/column/column11258.shtml编译的时候出现了文字超出页面的问题。这个问题在网上也有讨论。https://tex.stackexchange.com/questions/609199/how-to-set-bottom-padding-of-the-frontiers-of-computer-science-jour......
Chaosd 模拟两地三中心集群的网络环境
作者：pepezzzz环境准备集群名称和版本tidb集群:tidb-h版本：v6.6.0集群拓扑：单中心模拟部署两中心部署拓扑，延时要求如下：模拟场景源目标延时同城172.16.x.71,72172.16.x.73,741.5ms异地172.16.x.66~68,71~74,77172.16.x.67200ms软件版本：chaosdx86平台：curl-fsSL-ochaosd-v1.2......
rpi4-osdev-学习开发日志-2
前言大伙大概还没忘掉我之前说的话吧？有些那种一眼就知道怎么一回事或者那种只是单纯的接个线配置点东西看点成果的我一概不会理会的，也不会去写，没那个必要。那么，把代码编译一下吧。但是问题在于你用什么编译？怎么个编译法子？原文上来就介绍makefile是个啥以及教你写makefile，我们......
About Interviews and Learning------Learning journals 5
Thisweek,weproducedagroupassignment,aninterviewvideooncultural appropriation andappreciation,fromwhichwecanalwayslearnsomethinguseful。Ifthereisanythingtolearnfromit,Ithinkitisstillabouthowtoexpressandorgani......
systemd 的 journalctl 工具及其各种命令的基础知识介绍
导读本指南介绍了systemd的journalctl工具及其各种命令的基础知识。你可以使用这些命令对 Linux 中的桌面和服务器日志进行故障诊断。以下是如何使用journalctl......
Appropriation and Appreciation------learning journals 4
Therearemanyculturesinthisworld,butsomeculturesarerarelyknown,eveniftheyareknowntoacertainextent,leadingtotheexistenceofs......
The Indian World: On the Achievements and Consequences of Stereotypes.-------lea
Thistimewelearnedapoemnamed"IamnottheIndianinyourmind".ThispoemtellsaboutthestereotypeofIndiansintheworldandtheirviewsonth......

osd-journal-更新为-partuuid-方案

问题背景

适用版本

操作影响

解决方案

相关文章

赞助商

阅读排行