首页 > 其他分享 >一次服务器非法重启后导致的故障排查记录

一次服务器非法重启后导致的故障排查记录

时间:2022-10-27 14:32:09浏览次数:77  
标签:命令 排查 dev 故障 挂载 sdb 磁盘 服务器

作者:JackTian 来源:公众号「杰哥的IT之旅」 ID:Jake_Internet

大家好,我是杰哥。

前段时间遇到一个服务器问题:非法重启设备后,服务器进入救援模式,数据盘也不显示挂载是否成功。

说来这个问题,我觉得还挺奇葩。今天就来跟大家分享下整个过程以及我的处理方法。避免大家在今后的学习或工作中遇到跟我同样的问题。

一、问题背景

有一天,研发小伙伴跟我反馈有一台服务器连不上,一直卡在如下页面。

该页面是 Xshell 连接某一台服务器时,建立的连接,按![image.png](/i/li/?n=2&i=images/202210/b4754b2044d717c90e0015caacfb28e7bc60d0.png?,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)Ctrl+Alt+]键切换到本地 Shell 终端。当我看到卡在该页面时,毫无犹豫的自己也尝试了起来,果然也是连不上。前一天还正常连接,第二天就出问题了?

还好服务器有配置远程管理地址,通过远程控制管理页面的方式启动 iKVM HTML5 和远程管理服务器,这样就能登到这台出故障的设备上查看服务器界面处于一种什么样的状态。

登到这台故障的服务器后,直接重启了服务器,然后 Xshell 再次尝试连接,是可以远程连接的。难道这就是传说中的重启治百病,如此简单粗暴?

当进入系统后,执行简单的命令都提示输入/输出错误。

过不久后,直接不建立连接了,彻底挂了。。。

再通过远程控制管理页面查看服务器当前状态,一看进入到救援模式了。

到该模式下后,

  • 输入journalctl -xb命令,可查看系统日志
  • 输入systemctl reboot命令,重启系统
  • 输入systemctl default^D命令,再次尝试进入默认模式
  • 输入 root 用户密码,则可以进入系统

根据日志报错提示:挂载文件系统可以纠正该问题。

二、解决方案

执行df -h命令,用于在 Linux 操作系统下显示文件系统的磁盘使用情况。

使用-h选项以KB以上的单位来显示,可读性高。

  • 第一列:Filesystem文件系统的名称
  • 第二列:Size文件系统的容量
  • 第三列:Used已用多少的磁盘空间
  • 第四列:Avail可用多少的磁盘空间
  • 第五列:Use%磁盘使用率
  • 第六列:Mounted On挂载点

根据上图结果来看,没有/dev/sdb1文件系统所挂载的/bigdata目录磁盘情况。

尝试将/dev/sdb1取消挂载,重新挂载,反复报不同的错误。

通过 RAID 卡管理界面查看状态也是 Online。

当如果重启设备,能看到如下界面,则说明正在初始化设备。

恰巧,这台故障的服务器有多块硬盘组成的 44T 的一个目录有存放 46% 的数据,在有数据的情况下,如何不格式化磁盘重新挂载呢?

取消挂载

umount /dev/sdb1

尝试修复

若不确定挂载点属于哪种文件类型时,可以执行:df -Th命令来判断。

如果挂载点为xfs 文件类型,可以执行:xfs_repair -L + 文件系统名称路径命令进行修复。

如果挂载点为fsck.ext2/3/4文件类型,可以执行:fsck.ext2/3/4文件类型 + 文件系统路径命令进行修复。

因为我这是xfs的文件类型,按xfs_repair命令来修复受损的 xfs 文件系统,执行如下命令进行修复/dev/sdb1

xfs_repair -L /dev/sdb1

执行修复是根据磁盘中的数据使用率来决定修复时长的,所以时间会较长,我采用放后台的形式执行的,执行完成后,查看还是否有进程存在,如有则说明未修复完,如没有则说明修复完成,然后再重新挂载。

mount /dev/sdb1 /bigdata

挂载完毕后,执行df -h命令来确定是否挂载成功。

到此,就恢复挂载完毕了。

上面案例是针对磁盘有数据时且不格式化的情况下恢复并挂载。

那么有小伙伴该问了,无存储数据的情况下,如何挂载磁盘,我这里也给大家整理出来一个详细的操作步骤:

第一步:

ll /dev/disk/by-path  # 查看需要挂的磁盘名称
fdisk -l              # 查看磁盘信息
lsblk                 # lsblk 命令默认情况下将以树状列出所有块设备,包括查看磁盘挂载信息

第二步:

parted /dev/sdb mklabel gpt            # 新建 /dev/sdb 的磁盘标签类型为 GPT
parted /dev/sdb mkpart primary 0 100%  # 将 /dev/sdb 整个空间分给同一个分区
ignore                                 # 忽略上述执行命令后的告警
mkfs.xfs -f /dev/sdb                   # 格式化分区

注意:格式化分区可能会执行慢些,需耐心等待。

第三步:

mkdir /bigdata            # 创建目录,自定义目录名
mount /dev/sdb /bigdata   # 将 sdb 挂载到 /bigdata 目录下

第四步:

blkid   # 查看 sdb 的 UUID 并复制

第五步:

vi /etc/fstab    # 参考已挂载的磁盘,将 sdb 的 UUID 和挂载目录关联上,保存后重启设备

注意:UUID 一定要写对,否则重启后无法正常进入系统。

第六步:

df -h   # 检查是否挂载成功

按照上述操作步骤执行,肯定能操作成功。如果你有更好的解决方案,也欢迎大家留言分享。

参考文献

xfs_repair命令详解 https://bbs.qunyingkeji.com/2052/

推荐阅读


以上就是今天所要分享的全部内容了。

如果你觉得这篇文章对你有点用的话,为本文点个赞留个言或者转发一下,让更多的朋友看到,因为这将是我持续输出更多优质文章的最强动力!

标签:命令,排查,dev,故障,挂载,sdb,磁盘,服务器
From: https://blog.51cto.com/u_13959738/5799379

相关文章

  • 应用CPU占用高问题排查
    1、通过top命令查看其CPU占用可以看到其load占用为“20.14,16.42,19.16”,三个数字分别表示cpu在1分钟、5分钟及15分钟的load,cpu的使用率也偏高,达到了68.8%,占用cpu较高的......
  • win10启动和故障恢复中默认操作系统多余项怎么删除
    卡饭网本站整理2019-05-29电脑操作系统往往只需要一个就行了,多余的系统可以删掉,今天小编就介绍一下删除的方法。1.第一步,按下键盘上的快捷键【win+r】......
  • 热修复之mysqlcheck,(数据库xx is marked as crashed and should be repaired故障)
    数据库报xxismarkedascrashedandshouldberepaired故障。检查单个库中的所有表:#mysqlcheck-cbasename-uroot-pEnterpassword:如下扫描到错误:检查,优化,修......
  • 【服务器数据恢复】linux ext3文件系统执行FSCK后无法挂载的数据恢复案例
    服务器数据恢复环境:POWEREDGE系列某型号服务器;LINUX系统+RAID5。​服务器故障:管理员执行FSCK操作后LINUX系统无法MOUNT。服务器数据恢复过程:1、经过北亚数据恢复工程......
  • Node原生开发Web服务器介绍
     1.  使用Node创建一个HTTP的服务器,并能够接收到客服端发来的请求获取到客服端具体的请求数据,并根据不同的请求数据进行处理将处理之后的结果,响应回客户端,并断......
  • 存储交换机 服务器的组网
    存储的两个控制框冗余。。a控,b控连接同一个交换机 。。再来a控b控连接另外一个。。。。服务器再连接交换机。。  ......
  • 超高性价比的云服务器-华为云耀云服务器
    超高性价比的云服务器-华为云云耀云服务器自从国家鼓励个人创业,大学生自主创业以来,大批的中小企业开始像雨后春笋般涌现。近年来随着时代的发展,中小企业们又迅速推动自身的......
  • 某网站无法访问故障处理
    昨天用户反映在某区教育城域网内打开某网站xxx.yunxiao.com时无法访问,但是用手机流量可以正常打开,一开始用户怀疑是不是城域网内的DNS安全策略将网站给阻止了,于是将DNS改成......
  • 超高性价比的云服务器-华为云耀云服务器
    超高性价比的云服务器-华为云云耀云服务器自从国家鼓励个人创业,大学生自主创业以来,大批的中小企业开始像雨后春笋般涌现。近年来随着时代的发展,中小企业们又迅速推动自身......
  • web服务器6npm包与时间格式化案例
    第三方模块和包是同一个概念包是基于内置模块封装出来的https://www.npmjs.com/ 全球最大包共享平台https://registry.npmjs.org/ 下载包服务器//定义格式化......