首页 > 其他分享 >服务器数据恢复-EMC存储RAID5磁盘离线热备盘未激活的数据恢复案例

服务器数据恢复-EMC存储RAID5磁盘离线热备盘未激活的数据恢复案例

时间:2023-09-08 14:02:26浏览次数:52  
标签:数据恢复 RAID EMC 阵列 离线 RAID5 磁盘 LUN

服务器数据恢复环境:

北京某单位有一台EMC某型号存储,有一组由10块STAT硬盘组建的RAID5阵列,另外2块磁盘作为热备盘使用。RAID5阵列上层只划分了一个LUN,分配给SUN小机使用,上层文件系统为ZFS。


服务器故障:

存储RAID5阵列中有2块硬盘损坏离线,只有一块热备盘激活,RAID5阵列瘫痪,上层LUN无法正常使用。


服务器数据恢复过程:

1、将故障存储中所有磁盘编号后取出,由硬件工程师对所有磁盘做硬件故障检测,经过检测没有发现有硬盘存在物理故障和坏道。

服务器数据恢复-EMC存储RAID5磁盘离线热备盘未激活的数据恢复案例_zfs数据恢复

磁盘没有发现物理故障和坏道,初步推断是某些磁盘读写不稳定导致故障发生。EMC控制器的磁盘检测策略非常严格,一旦检测到某些磁盘性能不稳定,EMC控制器极有可能会判定这些磁盘为坏盘,将认定为坏盘的磁盘踢出RAID阵列。一旦RAID阵列中掉线的盘到达到该RAID级别允许掉盘的极限值,就会导致RAID阵列崩溃不可用,由于EMC存储的LUN都是基于RAID阵列的,RAID崩溃会导致基于该RAID阵列的LUN不可用。

2、将故障存储中所有磁盘以只读方式做全盘镜像备份,镜像完成后按照编号将所有磁盘还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。镜像完成后发现源磁盘的扇区大小为520字节,使用工具将镜像数据做520字节To512字节的转换。

3、基于镜像文件分析底层RAID5阵列的相关信息。经过分析发现发现其中有2块盘(8号盘和11号盘)完全没有数据,从管理后台上显示这2块盘是Hot Spare,8号盘替换了离线的5号盘。虽然8号盘作为热备盘成功激活,但该RAID级别为RAID5,因为有2块盘离线,所以该RAID5阵列还缺失一块硬盘,所以数据没有同步到8号盘中。继续分析其他10块硬盘,分析数据在硬盘中的分布规律、RAID条带的大小、盘序等相关信息。

4、根据上面步骤分析出来的RAID信息虚拟重构原RAID。由于整个RAID阵列中一共掉线两块盘,需要分析这两块盘掉线的顺序。经过分析发现有一块盘在同一个条带上的数据和其他盘明显不一样,因此初步判断此盘可能是先掉线的。使用北亚企安自主开发的RAID校验程序对这个条带做校验后确认先掉线的那块硬盘。

5、由于LUN是基于RAID阵列的,完成原RAID阵列的重组后分析LUN在RAID阵列中的分配信息和LUN分配的数据块MAP。根据LUN相关信息解释LUN的数据MAP并导出LUN的所有数据。

6、使用北亚企安自主开发的ZFS文件系统解释程序对生成的LUN做文件系统解释,在解释某些文件系统元文件的过程中程序报错。开发工程师对程序做debug调试并分析程序报错原因,经过数小时的分析与调试,发现无法解释文件系统的的原因是存储瘫痪导致ZFS文件系统中某些元文件损坏。人工修复这些损坏的元文件。

7、修复完成后解析ZFS文件系统,解析所有文件节点及目录结构。

服务器数据恢复-EMC存储RAID5磁盘离线热备盘未激活的数据恢复案例_zfs数据恢复_02

8、由用户方工程师对恢复出来的数据进行验证,验证过程中没有发现问题,确认恢复数据完整有效。本次数据恢复工作完成。

服务器数据恢复-EMC存储RAID5磁盘离线热备盘未激活的数据恢复案例_数据恢复_03

服务器数据恢复-EMC存储RAID5磁盘离线热备盘未激活的数据恢复案例_服务器数据恢复_04

标签:数据恢复,RAID,EMC,阵列,离线,RAID5,磁盘,LUN
From: https://blog.51cto.com/sun510/7409517

相关文章

  • 服务器数据恢复-断电导致Xen server虚拟化虚拟磁盘文件丢失,虚拟机不可用的数据恢复案
    服务器数据恢复环境:一台某品牌服务器通过一张同品牌某型号RAID卡将4块STAT硬盘组建为一组RAID10阵列。上层部署XenServer虚拟化平台,虚拟机上安装的是WindowsServer操作系统,包括系统盘+数据盘两个虚拟机磁盘,作为Web服务器使用,存放网站代码、SQLServer数据库以及其他网站数据。......
  • 离线安装docker docker-20.10.6
    离线安装dockerDocker是一个开源的应用容器引擎,它让开发者能够将应用打包在一个可移植的容器中,然后发布到任何流行的Linux机器或Windows机器上。通过使用Docker,开发者可以创建、部署和运行应用程序,而无需担心基础设施的问题。然而,在一些特定的环境下,如限制访问互联网的内部网络或外......
  • 宝塔历史版本离线包下载(附详细教程)
    宝塔历史版本下载(github中存在1.0.3-7.9.10符合大多数人使用的版本,部分版本如下):https://github.com/weiwang3056/baota_release/blob/main/LinuxPanel/LinuxPanel-7.5.1.ziphttps://github.com/weiwang3056/baota_release/blob/main/LinuxPanel/LinuxPanel-7.5.2.ziphttps://gi......
  • 内存函数,memcpy,memmove,memcmp,memset
    structs{ charname[20]; intage;};intmain(){ intarr1[]={1,2,3,4,5}; intarr2[5]={0}; structsarr3[]={{"张三",20},{"李四",18}}; structsarr4[3]; memcpy(arr4,arr3,sizeof(arr3)); //memcpy(arr2,arr1,sizeof(a......
  • 该Jenkins实例似乎已离线
    解决办法打开页面 http://127.0.0.1:8080/pluginManager/advanced,滑到低端,替换为https://mirrors.tuna.tsinghua.edu.cn/jenkins/updates/update-center.json或者http://mirror.esuni.jp/jenkins/updates/update-center.json 点击,重启容器后,  再次进入,当当当 完美......
  • 服务器数据恢复- 执行fsck导致Ext4分区无法挂载的数据恢复案例
    Ext4文件系统相关概念:块组:Ext4文件系统的空间被划分为若干个块组,每个块组内的结构大致相同。块组描述符表:每个块组都对应一个块组描述符,这些块组描述符统一放在文件系统的前部,称为块组描述符表。每个块组描述符大小为32字节,其主要描述块位图、i-节点位图及i-节点表的地址等信息。......
  • WSL中无法使用systemctl命令
    WSL使用system报错"Systemhasnotbeenbootedwithsystemdasinitsystem"(原文链接)[https://linuxhandbook.com/system-has-not-been-booted-with-systemd/]原因ThereasonisthatyouaretryingtousesystemdcommandtomanageservicesonLinuxbutyoursy......
  • 接入国标设备后离线状态国标GB28181视频平台LiteCVR不更新异常的处理
    根据使用者的反馈,我们得知在现场出现了LiteCVR通道显示离线的问题,并且需要手动点击更新按钮才能显示在线。针对这个问题,我们的技术人员立即进行了排查和解决。在排查过程中,我们的技术人员发现使用者现场没有开启auto_catalog参数,该参数仍然保持着false状态。我们的技术人员将该参数......
  • 银河麒麟服务器操作系统V10SP2离线安装Google Chrome浏览器
    https://blog.csdn.net/ShenSeKyun/article/details/132224932https://www.google.cn/chrome/index.htmlGOOGLE网址最下方下载LINUX版本的浏览器安装包打开终端,输入rpm-ivhgoogle-chrome-stable_current_x86_64.rpmyuminstall google-chrome-stable_current_x86_64.rpm......
  • 服务器数据恢复-vmware ESXI虚拟机误还原快照导致数据丢失的数据恢复案例
    服务器数据恢复环境:从物理机迁移一台虚拟机到ESXI,迁移后做了一个快照。该虚拟机上部署了一个SQLServer数据库,存放了5年左右的数据。ESXI上有数十台虚拟机,EXSI连接了一台EVA存储,所有的虚拟机都在EVA存储上。服务器故障:由于工作人员的误操作,不小心将几年前迁移数据后做的快照还原......