【分布式存储数据恢复】hbase和hive数据库数据恢复案例

时间：2022-12-16 11:07:02浏览次数：48

标签：数据恢复文件数据库 hive hbase 虚拟机 Block 分布式

分布式存储数据恢复环境：

16台物理服务器，每台物理服务器上有数台虚拟机；

虚拟机上配置分布式，上层部署hbase数据库和hive数据库。

【分布式存储数据恢复】hbase和hive数据库数据恢复案例_数据库数据恢复

分布式存储故障&分析：

误删除数据库底层文件，数据库不能使用。需要恢复hbase和hive数据库。

通过现场对用户环境的检测，数据恢复工程师发现虚拟机还可以正常启动，虚拟机上的数据库块文件丢失。块文件丢失之后没有新的数据写入操作，底层的数据损坏可能性比较小。

分布式存储数据恢复过程：

1、备份。

对物理服务器底层做备份。通过网络直接备份虚拟机底层磁盘文件。

准备一台服务器，以只读方式挂载所有服务器硬盘，使用磁盘备份工具进行扇区级别的备份。

2、分析块文件结构。

分析每个虚拟机磁盘的块文件&文件底层的聚合方式&每个磁盘中数据的分布情况。

3、分析Block文件key。

定位&提取并解析数据库文件中key信息，整合数据库文件key信息。

4、拼接Block文件。

根据Block文件的key信息提取文件片段，拼接提取出来的Block文件片段并校验拼接出来的Block文件的正确性。

5、导入Block文件。

校验提取出的Block文件完整性及正确性并把提取出来的Block文件导入到hbase和hive数据库中。

6、验证数据。

在北亚数据恢复工程师的协助下，由用户对恢复出来的数据进行验证。如果发现问题，重新检验上述所有过程。

标签：数据恢复,文件,数据库,hive,hbase,虚拟机,Block,分布式
From： https://blog.51cto.com/sun510/5946917

Hive: 一、优化篇
1.执行参数优化--分区SEThive.exec.dynamic.partition=true;SEThive.exec.dynamic.partition.mode=nonstrict;sethive.exec.max.dynamic.partitions.pernode=10000;......
Hive与HBase的整合
开场白：Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信，相互通信主要是依靠hive_hbase-handler.jar工具类(HiveStorageHandlers)，大致意思......
HBase RowKey设计
1HBase表热点1.1什么是热点检索habse的记录首先要通过rowkey来定位数据行。当大量的client访问hbase集群的一个或少数几个节点，造成少数regionserver的读/写请求过多、负......
【服务器数据恢复】raid6硬盘故障的数据恢复案例
服务器故障：服务器中一组由16块硬盘组成的raid6磁盘阵列，其中有一块硬盘由于物理故障掉线，服务器上层虚拟机不可用，部分分区丢失。用户重启服务器后发现上层数据还是处于丢失状......
【服务器数据恢复】VMware虚拟化重装系统导致服务器崩溃的数据恢复案例
服务器数据恢复环境：VMware虚拟化平台；vmfs文件系统。服务器故障&分析：误操作将虚拟化重装系统，服务器崩溃。正常情况下，重装系统会导致文件系统元文件很高的概率被覆盖。恢......
Flink 作为现代数据仓库的统一引擎：Hive 集成生产就绪！
Flink一直遵循“流优先，批是流的一个特例”的思想理念。在这一思想的指导下，Flink将最先进的流式处理技术运用到批处理中，使得Flink的批处理能力一早就令人印象深刻。特别......
Flink 1.10 SQL、HiveCatalog 与事件时间整合示例
Flink1.10与1.9相比又是个创新版本，在我们感兴趣的很多方面都有改进，特别是FlinkSQL。本文用根据埋点日志计算PV、UV的简单示例来体验Flink1.10的两个重要新特性：一......
你问我答3 - 关于Hive CLI与Beeline
请教一下，这个是cdp测试过程中，我这边想把hive命令默认client改为原来的hivecli，修改了use_beeline_for_hive_cli为false后,命令输入hive报了java.lang.NoClassDefFoundError:......
Hive压缩和存储
1Hadoop源码编译支持Snappy压缩1.1资源准备1）CentOS联网配置CentOS能连接外网。Linux虚拟机pingwww.baidu.com是畅通的注意：采用root角色编译，减少文件夹权限出现......
HIVE中，order by、sort by、 distribute by和 cluster by区别，以及cluster by有什么意义
HIVE中，orderby、sortby、distributeby和clusterby区别，以及clusterby有什么意义1.orederby主要是做全局排序。只要hive的sql中指定了orderby，那么所有的数......

【分布式存储数据恢复】hbase和hive数据库数据恢复案例

相关文章

赞助商

阅读排行