服务器虚拟机文件被损坏

时间：2024-06-21 14:31:52浏览次数：22

删除整个存储瘫痪，重启后无法使用，经过诊断后认为误删导致存储阵列损坏。
由于虚拟机的数量很多，每台都验证，所需的时间会很长，因此对整个VMFS卷做检测。在检测VMFS卷的过程中发现有部分虚拟机或虚拟机的文件被破坏。

一、恢复数据
1、生成数据；
经过对几台重要的虚拟机验证后，反应恢复的数据可以接受，立即着手准备恢复所有数据。
先准备目标磁盘，使用一台dell 的MD 1200加上11块3T的硬盘组成一个RAID阵列。接着将重组的RAID数据镜像到目标阵列上。然后利用专业的工具UFS解析整个VMFS文件系统。
2、尝试挂载恢复的VMFS卷；
将恢复好的VMFS卷连接到的虚拟化环境中的一台ESXI5.5主机上，尝试将其挂载到的ESXI5.5的环境中。VMFS本身有损坏，导致其挂载不成功。继续尝试使用ESXI的命令挂载也不成功，于是放弃挂载VMFS卷。
二、移交数据
将MD 1200 阵列上的数据，使用专业工具”UFS”依次导出VMFS卷中的虚拟机。
1、将MD 1200阵列上的数据通过HBA卡连接到VCenter服务器上。
2、在VCenter服务器安装“UFS”工具，然后使用“UFS”解释VMFS卷。
3、使用“UFS”工具将VMFS卷中的虚拟机导入到VCenter服务器上。
4、使用VCenter的上传功能将虚拟机上传到ESXI的存储中。
5、接着将上传完的虚拟机添加到清单，开机验证即可。
6、如果有虚拟机开机有问题，则尝试使用命令行模式修复。或者重建虚拟机并将恢复的虚拟机磁盘（既VMDK文件）拷贝过去。
7、由于部分虚拟机的数据盘很大，而数据很少。像这种情况就可以直接导出数据，新建一个虚拟磁盘，将导出的数据拷贝至新建的虚拟磁盘中即可。
统计整个存储中虚拟机的数量，大约有200台虚拟机。情况只能通过上述方式将恢复的虚拟机一台一台的恢复到用户的ESXI中。由于是通过网络传输，因此整个迁移的过程中网络是一个瓶颈。经过不断的调试以及更换主机最终还是无法达到一个理想的状态，最终还是决定在当前的环境迁移数据。

三、数据恢复总结
1、故障总结；
经过仔细分析后得出坏道的结论如下：
-除去SN：YHJ6LEUD上的一个自然坏道外，其余坏道均分布于RAID-6的Q校验块中。
-坏道区域多数表现为完整的256个扇区，正好当时创建RAID-6时的一个完整RAID块大小。
-活动区域表现为坏道，非活动区域坏道有可能不出现，如热备盘，上线不足10%，坏道数量就比其他在线盘少（热备盘的镜像4小时完成，其他有坏道盘大概花费40小时）
-其他非Q校验区域完好，无任何故障。
2、结论：
通常情况，经如上坏道规则表现可推断，坏道为控制器生成Q校验，向硬盘下达IO指令时，可能表现为非标指令，硬盘内部处理异常，导致出现规律性坏道。
3、数据恢复总结；
数据恢复过程中由于坏道数量太多，以致备份数据时花费了很长世间。整个存储是由坏道引起的，导致最终恢复的数据有部分破坏，但不影响整体数据，最终的结果也在可接受范围内。

标签：RAID,数据,虚拟机,损坏,VMFS,服务器,UFS,坏道
From： https://www.cnblogs.com/saiyikeji/p/18260460

KVM虚拟机安装部署全攻略 cockpit
01原理KVM（Kernel-basedVirtualMachine）虚拟化技术是一种基于内核的虚拟化技术，KVM虚拟化技术的实现依赖于CPU的虚拟化扩展（如IntelVT和AMD-V）。当宿主机启动时，KVM会加载一个轻量级的内核模块kvm.ko，该模块负责与硬件进行交互，实现虚拟机的创建、管理和调度。 02组成●KVM内......
提交数据库事务时报告了一个错误，但无法确定该事务在数据库服务器上是成功还是失败
客户的库偶尔报下面这个错误：Anerrorwasreportedwhilecommittingadatabasetransactionbutitcouldnotbedeterminedwhetherthetransactionsucceededorfailedonthedatabaseserver日志里记超时，而程序里设置的超时时间是3小时，这里3-5分钟就超时了......
华为OD 可以组成网络的服务器
题目描述：在一个机房中，服务器的位置标识在n*m的整数矩阵网格中，1表示单元格上有服务器，0表示没有。如果两台服务器位于同一行或者同一列中紧邻的位置，则认为它们之间可以组成一个局域网。请你统计机房中最大的局域网包含的服务器个数。输入描述：第一行输入两个正整数，n和m，0<......
Oracle系列---【数据库账号频繁被锁定，如何定位到是哪台服务器器导致的？】
1.问题描述接审计要求，已上线的数据库的密码属于弱口令，需要更改成严格的，但是服务又不能停机，这种情况下，只能在原有用户名上新增代理用户，这里不能用新建用户的方案，因为用户间不能共用schema,所以只能用新增代理用户的方案。切换到代理用户的过程中发现，"ORA-28000:Theaccountisl......
磁盘扩容 centos 磁盘扩容会损坏数据吗
以下场景经常会遇到：在安装系统的时候可能没有合理的分配空间，导致某些分区空间吃紧，而另外一些空间基本使用不到；由于业务量激增->数据量激增，磁盘空间被用光；这种情况下重新调整磁盘分区就很有必要。但是系统的数据都是很宝贵的，调整空间的前提是保证当前数据不被破坏。相关概念分......
服务器数据恢复成功案例
一、服务器数据恢复描述需要进行数据恢复的服务器为OceanStorS6800T，服务器硬件配置情况为15块磁盘组成一组80T大小的raid5阵列，阵列划分为两个lun、三个分区。服务器重装系统后发现磁盘分区丢失了一个，需要进行服务器数据恢复。二、服务器数据备份服务器数据恢复第一步需要对故......
服务器数据库
数据库往往是服务器中最核心的部分，所以一旦数据库发生损坏，将会带来巨大的损失，因此数据库的数据恢复功能变得越来越重要了。在服务器运行过程中，由于断电、操作不当原因损坏到服务器的硬盘的时候，怎样才能恢复网站服务器的数据呢？一、服务器存储系统非常重要，硬盘作为服务器数据存储......
服务器数据恢复-重建MDisk导致VDisk丢失的数据恢复案例
服务器数据恢复环境：IBM某型号存储；Solaris操作系统，部署Oracle数据库。服务器故障：重建MDisk导致对应的存储池中的VDisk丢失，导致Solaris操作系统中的Oracle数据库无法使用。服务器数据恢复过程：1、将所有涉及到Oracle数据库的VDisk以只读模式连接到备份服务器上，在只读模式下对......
服务器雪崩的应对策略之----熔断机制
熔断机制（CircuitBreaker）是一种保护系统稳定性的重要手段。它的主要目的是防止系统在依赖的服务出现问题时，继续发送请求，从而保护系统免受进一步的影响。熔断机制通过监控请求的成功和失败率，在检测到故障率超过预设阈值时，自动切换到熔断状态，停止对故障服务的请求。熔断状态一......
服务器雪崩的应对策略之----降级处理
降级处理（FallbackHandling）是一种在系统出现故障或压力过大的情况下，通过提供简化或备用服务来维持系统基本功能的技术。降级处理可以帮助系统在部分功能失效时依然能够提供基本的服务，从而提高系统的可用性和用户体验。常见的降级处理方法一、降级处理策略二、不同策略的......

服务器虚拟机文件被损坏

相关文章

赞助商

阅读排行