服务器数据恢复环境:
某银行服务器,共十三块磁盘。
服务器故障&分析:
某公司银行业务突然崩溃,无法正常使用,银行运维人员排查服务器故障,发现服务器有多块硬盘故障离线,上层应用崩溃,服务器无法正常工作。由于服务器内的数据十分重要,不仅需要对服务器硬盘进行物理故障修复,还需要恢复服务器内的数据。于是运维人员联系我们数据恢复中心寻求帮助。
由于故障服务器内出现大量硬盘掉线的情况,北亚数据恢复工程师初步判断是由于服务器磁盘阵列中硬盘掉线数量超过服务器磁盘阵列冗余级别允许的最大数量,导致服务器瘫痪。可以通过修复硬盘物理故障,提取故障盘数据后重组raid的方式恢复服务器数据。
服务器数据恢复过程:
1、北亚工程师首先对故障服务器进行了初检,发现故障服务器raid磁盘阵列中十三块磁盘中的4块硬盘处于离线状态。
2、对离线硬盘进行物理故障检测,发现离线硬盘中均存在大量坏道。硬件工程师使用专用设备对坏道硬盘进行了物理修复,对修复好的硬盘做镜像备份。
3、对没有发现物理故障的完好硬盘做镜像备份,将所有硬盘数据备份到准备好的存储池中,以备数据分析和恢复使用。
4、分析raid结构并虚拟重组raid磁盘阵列,验证重组的磁盘阵列的可用性。如果验证不通过则重新分析调整重组阵列,直至验证结果正常,数据可用。
5、将恢复好的数据交付用户亲自验证,没有发现问题。
服务器数据安全Tips:
1、服务器发生故障后,切忌对服务器进行操作;也不要随意取出硬盘,以免弄乱盘序。
2、如果需要取出硬盘,标记好硬盘的顺序之后再取出。
3、服务器阵列瘫痪后应该立即断电,不要做同步或强制上线操作,防止数据进一步破坏。
标签:数据恢复,离线,故障,服务器,硬盘,磁盘阵列 From: https://blog.51cto.com/sun510/5901482