首页 > 其他分享 >8块硬盘故障的存储异常恢复案例一则

8块硬盘故障的存储异常恢复案例一则

时间:2024-03-13 09:30:17浏览次数:31  
标签:重构 存储 rac 运维 故障 硬盘 冗余

关键词

  • 华为存储、硬盘域、LUN
  • 热备冗余、重构、预拷贝
  • oracle rac、多路径

     There are many things that can not be broken!

     如果觉得本文对你有帮助,欢迎点赞、收藏、评论!

一、问题现象

近期遇到的一个案例,现象是一套oracle rac数据库双节点全挂了,原因是后端存储无法识别;然后运维人员登录到华为存储上,是不看不知道,一看吓一跳。存储日志记录显示,从20年开始,同一个硬盘域下,陆续坏了有8块盘!!在第8块盘坏的时候,硬盘域已经没有多余空间进行数据重构,硬盘域处于故障状态,下面所有LUN无法读写;显然这台存储是一直处于无人管理的状态下啊,几年里的坏盘都无人问津。

二、问题处理

针对这一情况,以前遇到过类似情形,只是同时坏2-3块盘的raid掉线,本次虽然有8块盘异常,本质上情形还是一样,只是这台存储使用的空间不多,有足够的冗余空间够磁盘多坏几块。前期写过一篇关于这类故障情况华为存储的处理建议,参考如下:

https://vincentwong.blog.csdn.net/article/details/135291665

本次故障介入处理时,运维已经备新盘到现场,准备进行更换,更换前拔除了最后一块坏的硬盘。此时查看硬盘域处于重构过程中挂了,担心最后一块盘上还有数据,故让插回该硬盘,准备手动去拉起下该硬盘看下。

结果,硬盘插回后,存储又重新正常识别了该硬盘,并标记成good状态,说明硬盘可能只是存在部分坏块,还没有彻底坏掉。因为老硬盘上数据还在,存储硬盘域的重构也很快完成,硬盘域立马恢复正常状态,LUN组也恢复成正常可用状态。

紧接着就是依次对存储其他坏盘进行更换,恢复硬盘域的冗余保护。

存储恢复正常后,业务oracle rac集群未能自动恢复,原因是存储异常时,rac集群触发了系统重启,重启后的磁盘识别一直不正常,当存储恢复后,没法自动恢复。此时对两台主机节点再次重启系统后,数据库实例均恢复正常,数据未丢失,不幸中万幸。

三、结论总结

1、存储硬盘域的好处就是可以把所有硬盘空间混在一起,热备的冗余可以不只是某几块固定硬盘的空间,只要存储使用不够多,剩余空间都可以用来冗余。

2、遇事不要慌,按步骤进行去恢复尝试,遇到不清楚的地方也可以再去找下官方售后技术支持,总能找到解决的办法。

3、日常运维过程中,第一步还是要对你所运维的对象做个盘点,一个也不能少,不然说不定哪天给你捅个大篓子啊!

标签:重构,存储,rac,运维,故障,硬盘,冗余
From: https://blog.csdn.net/vincent0920/article/details/136651298

相关文章

  • k8s 1.23 nfs动态存储nfs-subdir4.0.18
    参考 https://blog.csdn.net/m0_51510236/article/details/132641343nfs服务器:192.168.18.12master:192.168.18.111、在nfs服务器安装nfsyuminstallnfs-utils-yvim/etc/exports/data/nfs/data1G*(rw,no_root_squash,no_all_squash,sync)/data/nfs/data2G*(rw,no_r......
  • 固态存储是未来|浅析SSD架构的演进与创新技术-1
    常见的SSD架构中,包括了SSD控制器、NAND颗粒、DRAM颗粒三大组件,SSD控制器的固件需要兼顾坏块管理、ECC纠错、垃圾回收GC、磨损均衡WL、NANDdie介质管理、缓存交互等等。随着时代的发展,SSD架构,也不断有新的挑战和需求。基于小编目前的看到的信息,总结大概有几个方面:首先就......
  • 固态存储是未来|浅析SSD架构的演进与创新技术-2
    除了性能和容量这两个最大的诉求外,其他的需求已经成为SSD现场架构的核心竞争力。一是安全性:随着数据安全威胁日益严重,SSD的安全设计成为关键,包括提供单芯片硬件信任根、遵循FIPS140-3安全标准以及支持一次性可编程位字段来锁定生产后的接口,确保数据加密传输和保护,并集成加密引......
  • 操作系统实验——进程通信(共享存储区通信)实验
    一、实验目的:了解和熟悉共享存储机制   实验内容:编制一长度为1k的共享存储区发送和接收的程序。三、实验步骤及结果://把实验运行过程和相关代码,或者实验结果等截图拷贝过来1、了解共享存储区的机制共享存储区(ShareMemory)是UNIX系统中通信速度最高的一种......
  • oracle 存储过程
    createorreplaceprocedureinst_XXXisiint;--定义变量internal_keynumber(15);seq_novarchar2(35);barnchvarchar2(8);begin--开始 i:=1;---变量赋值internal_key:=1;whilei<100000LOOP;---while循环seq_no:='A'||TO_CHAR(i); ---字符拼接用||   int......
  • 视频监控/云存储EasyCVR视频融合平台设备增删改操作不生效是什么原因?
    国标GB28181协议EasyCVR安防平台可以提供实时远程视频监控、视频录像、录像回放与存储、告警、语音对讲、云台控制、平台级联、磁盘阵列存储、视频集中存储、云存储等丰富的视频能力,平台支持7*24小时实时高清视频监控,能同时播放多路监控视频流,视频画面1、4、9、16个可选,支持自定义......
  • etcd每个节点都存储了完整的键值对数据集,为什么扩容etcd集群仍可分散存储压力?
    etcd每个节点都存储了完整的键值对数据集,这主要是为了确保数据的一致性和高可用性。在这种设计下,任何一个节点都可以处理读取请求,并在本地提供数据,从而无需跨节点通信。这种冗余的数据存储方式也增加了系统的容错性,因为即使部分节点发生故障,其他节点仍然可以提供完整的数据集。然......
  • typeorm mysql blob 存储base64
    typeormmysqlblob存储base64在TypeORM中,要将Base64数据存储到MySQL数据库的BLOB字段,您需要先将Base64字符串转换为Buffer,然后使用TypeORM的实体管理器来保存。以下是一个简单的例子:首先,定义您的实体:  import{Entity,PrimaryGeneratedColumn,Column}from......
  • Smb3.0多通道技术及故障排查
    Smb3.0多通道技术有RSS和RDMA网卡或两种网卡叠加实现微软是建议网卡带有RSS和RDMA,因为RDMA网卡很贵我没有条件测试。以下针对RSS-SMBRSS(receivesidescaling)功能中文名叫“接收端调整”,CPU多核心时,每核心(非超线程)可用一个线程发起一个通道。SMB多通道的要求由于默认情......
  • 记一次type-c接口外接硬盘没反应的解决方法
    我用的是外接硬盘,所以会出现这种情况,因此,我会把遇见的问题分享给大家,若有不足,请补充,非常感谢。先把电脑上的所有连接设备都拔掉,然后关闭电脑,彻底关机后长按开机键不松手保持15秒以上(这个操作本身正常不会丢失数据的,但是特别重要的数据资料可以备份一下,以防万一),然后插电源按一下......