首页 > 其他分享 >ceph满盘导致业务停止后的终极补救措施

ceph满盘导致业务停止后的终极补救措施

时间:2023-04-25 10:13:55浏览次数:33  
标签:文件 删除 补救措施 ceph 满盘 txt osd

ceph满盘导致业务停止后的终极补救措施

现象:磁盘满,osd异常

此时ceph集群停止业务,且不能执行 rbd rm glance/***** 命令删除任何文件。

解决办法:

方法一:调高ceph的满盘比例,比如原值0.95为满盘,现在修改为0.98修改所有ceph节点 /etc/ceph/ceph.conf

添加

mon osd full ratio = 0.98

mon osd nearfull ratio = 0.80

然后重启所有ceph节点即可

/etc/init.d/ceph -a restart

如果方法一无法解决,则使用方法二。

方法二:通过到磁盘上直接删除文件腾出空间,删除的文件属于镜像文件,所以不影响用户的业务:

操作步骤:

1:获取nova池中所有文件:

2:遍历nova池中所有文件:

非常重要:只有所有nova 文件的 parent里面都没有出现过的glance 镜像才可以删除

3:遍历完毕,假如下图红框中的3个镜像文件没有在所有nova的parent中出现过,则可以删除

3:以删除07d588c5-8a5d-450a-8baa-65f0ce563df3为例 rbd info glance/07d588c5-8a5d-450a-8baa-65f0ce563df3 获取prefix

4:

直接登录磁盘满所在机器,假设为osd.0

5:

  1. 登录osd.0所在磁盘目录cd /var/lib/ceph/osd/ceph-0
  2. 登录pg所在目录cd current
  3. 然后查找该镜像文件所在的目录,并替换“\”,输出到文件new.txt中: find . -type f -name *12d85b57e857* > ./a.txt

sed 's/\\/\\\\/g' a.txt > new.txt

  1. 删除new.txt中的所有文件 while read line;do rm ${line};done < new.txt

标签:文件,删除,补救措施,ceph,满盘,txt,osd
From: https://www.cnblogs.com/xuning-xuning/p/17351794.html

相关文章

  • Ceph_osd_应急权重调整方案
    目录1.问题背景2.操作影响3.适用版本4.操作范围5.操作周期6.操作步骤6.1查看当前osd数据状态6.2计算需要调整的osd权重6.3调整权重7.回退步骤1.问题背景集群pg数量规划不合理,导致在集群存入大量的数据之后,osd上的数据分布不均衡,部分osd的存储百分比接近或超......
  • ceph慢请求处理
    故障现象虚机重启后黑屏,无任何报错提示故障处理1、查询ceph状态发现异常并且有慢请求2、查看日志发现有大量慢请求3、查询集群延迟最高的osd,发现为28、57、34、39、494、查询osd的信息,发现主机都是mon03节点5、集群打标签6、将慢请求的osd停止服务7、集群停止慢请求8、虚机重启后......
  • ceph的常见命令
    1、ceph设置回填速度foriin{0..125}docephtellosd.$iinjectargs"--osd_max_backfills1";doneforiin{0..125}docephtellosd.$iinjectargs"--osd_recovery_max_active1";doneforiin{0..125}docephtellosd.$iinjectar......
  • Ceph Pacific 版本磁盘预测模块
    磁盘预测模块利用Ceph设备运行状况检查来收集磁盘运行状况指标,并使用内部预测器模块生成磁盘故障预测并返回到Ceph。它不需要任何外部服务器进行数据分析和输出结果。其内部预测器的准确率约为70%。1.启用运行以下命令以在Ceph环境中启用diskprediction_local模块:cephmg......
  • Ceph Pacific 各版本镜像说明
    16.2.11容器镜像root@ubuntu-20-04-lts:~#dockerimagesREPOSITORY            TAG    IMAGEID   CREATED    SIZEregistry             2     0d153fadf70b 2monthsago  ......
  • Proxmox VE Ceph 集群部署
    1、集群安装参考:https://www.cnblogs.com/a120608yby/p/17295938.html2、业务及管理网络创建参考:https://www.cnblogs.com/a120608yby/p/17140953.html3、Ceph网络创建#配置ceph多网卡绑定#vim/etc/network/interfaces...autobond1ifacebond1inetmanual......
  • 实战篇:使用rook在k8s上搭建ceph集群
    写在开篇“上一次,我发了一篇:《理论篇:让我们一起鲁克鲁克——rook(开源存储编排)》。这次,来一篇实战,使用rook在k8s上把ceph集群搞起来。后续,还会陆续分享如何对接k8s(作为k8s的后端存储)、以及分享一些在生产上的实践经验。”环境规划主机名IP角色数据磁盘k8s-a-mast......
  • ceph分布式存储搭建
    CEPH分布式存储搭建本文通过参考臧雪园老师的文档根据实际操作做修改,详细视频链接参考:https://edu.51cto.com/course/15982.html集群配置信息:安装的ceph版本:配置所需源的地址wget-O/etc/yum.repos.d/CentOS-Base.repohttp://mirrors.aliyun.com/repo/Centos-7.re......
  • ceph版本及生命周期、查看命令
    ceph版本https://blog.whsir.com/post-6687.html查看ceph版本的命令要查看Ceph的版本,可以使用以下命令:ceph--version或者:ceph--version|grepceph这些命令将打印出Ceph的版本信息,例如:cephversion14.2.21(f90a3fe2e8f97a69de958ff472c30edfe9e9dcdc)nautilus(stable)其中,“......
  • Ceph——使用普通用户挂载cephfs
    创建客户端账户  创建账户  创建一个名为lxhfs的普通账户,允许获取ceph状态信息,允许对mds元数据有读写权限,语序对存储池cephfs-datacephfs的存储池有读写和执行权限......