服务器故障&分析:
某银行的业务模块崩溃,无法正常使用。排查服务器故障,发现运行该业务模块的服务器中多块硬盘离线,导致上层应用崩溃。
故障服务器内多块硬盘掉线,硬盘掉线数量超过服务器raid阵列冗余级别所允许的硬盘掉线数量,导致服务器瘫痪。可以通过修复硬盘物理故障,提取故障盘数据后重组raid的方案来恢复服务器数据。
服务器数据恢复过程:
1、将故障服务器中所有磁盘编号后取出。北亚企安数据恢复工程师对服务器进行了初检,发现故障服务器13块磁盘中的4块处于离线状态。
2、由硬件工程师对离线硬盘进行物理故障检测,检测后发现掉线硬盘中均存在大量坏道。北亚企安硬件工程师对存在坏道的掉线硬盘进行了物理修复,然后以只读方式给这些硬盘和其他完好的硬盘做全盘镜像。镜像完成后将所有硬盘按照编号还原到原服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件分析服务器中的raid结构,北亚企安数据恢复工程师利用分析获取到的raid相关信息虚拟重组raid阵列,重组完成后验证磁盘阵列的可用性。
4、如果验证不通过则重新分析raid结构并调整参数重组raid阵列,直到验证数据可用没有问题。
5、将恢复好的数据交由用户方验证,经过验证后用户方认可恢复结果。本次数据恢复工作完成。
Tips:
1、服务器出现故障后,切忌再对服务器进行任何操作,不要随意取出硬盘,以免弄乱硬盘顺序,增加后期数据恢复的难度。
2、如果必须取出硬盘,请提前标记好硬盘的顺序。
3、求助专业服务器数据恢复机构。
4、如果服务器内存储的是保密度较高、较为重要的数据资料,建议配备服务器数据恢复设备,防止在数据恢复过程中造成数据丢失或泄露。
标签:数据恢复,raid,掉线,故障,服务器,硬盘 From: https://blog.51cto.com/sun510/7955684