首页 > 数据库 >【分布式存储数据恢复】hbase和hive数据库数据恢复案例

【分布式存储数据恢复】hbase和hive数据库数据恢复案例

时间:2022-12-16 11:07:02浏览次数:44  
标签:数据恢复 文件 数据库 hive hbase 虚拟机 Block 分布式

分布式存储数据恢复环境:

16台物理服务器,每台物理服务器上有数台虚拟机;

虚拟机上配置分布式,上层部署hbase数据库和hive数据库。

【分布式存储数据恢复】hbase和hive数据库数据恢复案例_数据库数据恢复

分布式存储故障&分析:

误删除数据库底层文件,数据库不能使用。需要恢复hbase和hive数据库。

通过现场对用户环境的检测,数据恢复工程师发现虚拟机还可以正常启动,虚拟机上的数据库块文件丢失。块文件丢失之后没有新的数据写入操作,底层的数据损坏可能性比较小。


分布式存储数据恢复过程:

1、备份。

对物理服务器底层做备份。通过网络直接备份虚拟机底层磁盘文件。

准备一台服务器,以只读方式挂载所有服务器硬盘,使用磁盘备份工具进行扇区级别的备份。

2、分析块文件结构。

分析每个虚拟机磁盘的块文件&文件底层的聚合方式&每个磁盘中数据的分布情况。

3、分析Block文件key。

定位&提取并解析数据库文件中key信息,整合数据库文件key信息。

4、拼接Block文件。

根据Block文件的key信息提取文件片段,拼接提取出来的Block文件片段并校验拼接出来的Block文件的正确性。

5、导入Block文件。

校验提取出的Block文件完整性及正确性并把提取出来的Block文件导入到hbase和hive数据库中。

6、验证数据。

在北亚数据恢复工程师的协助下,由用户对恢复出来的数据进行验证。如果发现问题,重新检验上述所有过程。



标签:数据恢复,文件,数据库,hive,hbase,虚拟机,Block,分布式
From: https://blog.51cto.com/sun510/5946917

相关文章

  • Hive: 一、优化篇
    1.执行参数优化--分区SEThive.exec.dynamic.partition=true;SEThive.exec.dynamic.partition.mode=nonstrict;sethive.exec.max.dynamic.partitions.pernode=10000;......
  • Hive与HBase的整合
    开场白:Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive_hbase-handler.jar工具类(​​HiveStorageHandlers​​),大致意思......
  • HBase RowKey设计
    1HBase表热点1.1什么是热点检索habse的记录首先要通过rowkey来定位数据行。当大量的client访问hbase集群的一个或少数几个节点,造成少数regionserver的读/写请求过多、负......
  • 【服务器数据恢复】raid6硬盘故障的数据恢复案例
    服务器故障:服务器中一组由16块硬盘组成的raid6磁盘阵列,其中有一块硬盘由于物理故障掉线,服务器上层虚拟机不可用,部分分区丢失。用户重启服务器后发现上层数据还是处于丢失状......
  • 【服务器数据恢复】VMware虚拟化重装系统导致服务器崩溃的数据恢复案例
    服务器数据恢复环境:VMware虚拟化平台;vmfs文件系统。服务器故障&分析:误操作将虚拟化重装系统,服务器崩溃。正常情况下,重装系统会导致文件系统元文件很高的概率被覆盖。恢......
  • Flink 作为现代数据仓库的统一引擎:Hive 集成生产就绪!
    Flink一直遵循“流优先,批是流的一个特例”的思想理念。在这一思想的指导下,Flink将最先进的流式处理技术运用到批处理中,使得Flink的批处理能力一早就令人印象深刻。特别......
  • Flink 1.10 SQL、HiveCatalog 与事件时间整合示例
    Flink1.10与1.9相比又是个创新版本,在我们感兴趣的很多方面都有改进,特别是FlinkSQL。本文用根据埋点日志计算PV、UV的简单示例来体验Flink1.10的两个重要新特性:一......
  • 你问我答3 - 关于Hive CLI与Beeline
    请教一下,这个是cdp测试过程中,我这边想把hive命令默认client改为原来的hivecli,修改了use_beeline_for_hive_cli为false后,命令输入hive报了java.lang.NoClassDefFoundError:......
  • Hive压缩和存储
    1Hadoop源码编译支持Snappy压缩1.1资源准备1)CentOS联网配置CentOS能连接外网。Linux虚拟机ping​​www.baidu.com​​是畅通的注意:采用root角色编译,减少文件夹权限出现......
  • HIVE中,order by、sort by、 distribute by和 cluster by区别,以及cluster by有什么意义
    HIVE中,orderby、sortby、distributeby和clusterby区别,以及clusterby有什么意义1.orederby主要是做全局排序。​ 只要hive的sql中指定了orderby,那么所有的数......