华为云耀云服务器L实例--Hive的部署

时间：2023-12-29 18:25:21浏览次数：43

标签：bin -- 云耀云 Hadoop hive server export Hive

产品官网：https://www.huaweicloud.com/product/hecs-light.html

今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，继续Hive的部署

Hive 是建立在 Hadoop 上的一个数据仓库和查询系统。它提供了类似 SQL 的查询语言（称为 HiveQL）来查询和分析存储在 Hadoop 分布式文件系统（HDFS）中的大规模数据。Hive 的设计目标是使非技术用户能够通过类似于 SQL 的语言来查询和分析大规模数据集，而无需深入了解复杂的编程模型。

以下是 Hive 的一些主要特点和概念：

1. HiveQL语言： Hive 提供了 Hive 查询语言（HiveQL），这是一种类似于 SQL 的语言，允许用户执行查询、过滤和聚合等操作。HiveQL查询会被转化为一系列的 MapReduce 作业，从而在底层利用 Hadoop 进行分布式计算。

2. 元数据存储： Hive 使用元数据存储来存储表模式和统计信息。默认情况下，它使用嵌入式的 Derby 数据库，但也可以配置为使用其他数据库，如 MySQL 或 PostgreSQL。

3. 表和分区： Hive中的数据组织为表，表可以分为分区以提高查询性能。分区允许根据表中的某些列将数据划分为更小的部分，以便更有效地执行查询。

4. UDF（用户定义函数）： Hive 支持用户定义的函数，这允许用户编写自定义的处理逻辑，并将其嵌入到 HiveQL 查询中。

5. 可扩展性： Hive 可以与 Hadoop 生态系统中的其他工具集成，包括 HBase、Spark、Tez 等，以便更灵活地处理不同类型的数据和查询。

6. 批处理： Hive 通常用于大规模批处理，适用于处理大量的静态数据。对于需要实时性能的场景，可能需要考虑其他工具，如 Apache Spark。

Hive 的使用场景主要涉及数据仓库和数据分析，特别是当数据规模很大，而且对实时性能没有过高要求时。通过使用 HiveQL，用户可以利用 SQL 风格的查询语言来分析和挖掘庞大的分布式数据集。

以下是在华为云耀云服务器L实例配置Hive的步骤。

（1）配置 Hadoop

Hive 的运行依赖于 Hadoop （ HDFS 、 MapReduce 、 YARN 都依赖）

同时涉及到 HDFS 文件系统的访问，所以需要配置 Hadoop 的代理用户

即设置 hadoop 用户允许代理（模拟）其它用户

配置如下内容在 Hadoop 的 core-site.xml 中，重启 HDFS 集群

（2) 下载解压 Hive

• 切换到 hadoop 用户

su - hadoop

• 下载 Hive 安装包：

http://archive.apache.org/dist/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz

• 解压到 node1 服务器的： /export/server/ 内

tar -zxvf apache-hive-3.1.3-bin.tar.gz -C /export/server/

• 设置软连接

ln -s /export/server/apache-hive-3.1.3-bin /export/server/hive

(3）提供 MySQL Driver 包

• 下载 MySQL 驱动包：

https://repo1.maven.org/maven2/mysql/mysql-connector-java/5.1.34/mysql-connector-java-

5.1.34.jar

• 将下载好的驱动 jar 包，放入： Hive 安装文件夹的 lib 目录内

mv mysql-connector-java-5.1.34.jar /export/server/hive/lib/

（4）配置 Hive

• 在 Hive 的 conf 目录内，新建 hive-site.xml 文件，填入以下内容

（5）初始化元数据库

至此， Hive 的配置已经完成，现在在启动 Hive 前，需要先初始化 Hive 所需的元数据库。

• 在 MySQL 中新建数据库： hive

CREATE DATABASE hive CHARSET UTF8;

• 执行元数据库初始化命令：

cd /export/server/hive

bin/schematool -initSchema -dbType mysql -verbos

（6）启动 Hive （使用 Hadoop 用户）

• 确保 Hive 文件夹所属为 hadoop 用户

• 创建一个 hive 的日志文件夹：

mkdir /export/server/hive/logs

• 启动元数据管理服务（必须启动，否则无法工作）

前台启动： bin/hive --service metastore

后台启动： nohup bin/hive --service metastore >> logs/metastore.log 2>&1 &

• 启动客户端，二选一（当前先选择 Hive Shell 方式）

Hive Shell 方式（可以直接写 SQL ）： bin/hive

Hive ThriftServer 方式（不可直接写 SQL ，需要外部客户端链接使用）： bin/hive --service hiveserver2

至此，我们已经成功在华为云耀云服务器L实例部署并启动了单台服务器上的hive服务。

标签：bin,--,云耀云,Hadoop,hive,server,export,Hive
From： https://www.cnblogs.com/jishuseng/p/17935483.html

sql性能优化
前言：实现完rpc接口后，开始进行性能优化，提升响应效率。 1，查全量表，如果表格几万条，甚至更多信息时，导致性能下降。//consttickInfos=awaitknex(SRC20_TICK_TABLE);//consttickInfoMap={}//for(letitemoftickInfos){//tickInfoMap[item.tick]=item//}解决......
30 RS485串口程序收发环路设计
软件版本：VIVADO2021.1操作系统：WIN1064bit硬件平台：适用XILINXA7/K7/Z7/ZU/KU系列FPGA登录米联客(MiLianKe)FPGA社区-www.uisrc.com观看免费视频课程、在线答疑解惑！1概述在前面的课程中，我们已经学习了UART串口程序的设计，在工业场合为了提高串口的抗干扰能力，以及传输距离，RS4......
2023总结与展望--Empirefree
今年一篇博客都没写过了，好像完全在忙在工作和生活上面了，珍惜自我，保持热情，2024对我好点目录......
使用Pipenv进行Python虚拟环境管理--conda平替
Pipenv使用教程Anaconda是一个开箱即用的Python开发环境，同时也包含虚拟环境管理工具conda。但是Anaconda的缺点包括：大型安装包：Anaconda的安装包相对较大，需要消耗较多的磁盘空间。依赖冲突：在使用Anaconda时，若安装包过多可能会出现依赖冲突的情况，需要手动解决。此时则......
31 基于FPGA简易示波器显示驱动设计
软件版本：VIVADO2021.1操作系统：WIN1064bit硬件平台：适用XILINXA7/K7/Z7/ZU/KU系列FPGA登录米联客(MiLianKe)FPGA社区-www.uisrc.com观看免费视频课程、在线答疑解惑！1概述FPGA在数据采集，数据处理，图像视频领域都有广泛的应用。很多FPGA工程师苦恼，如何让FPGA采集的数据可以直......
2023年度评奖：PC处理器篇
2023年的PC处理器市场，可谓精彩纷呈。既有Intel、AMD这一对宿敌的针锋相对，也有苹果、高通新势力的异军突起，更有龙芯、兆芯等国产处理器的持续发力。AMD现阶段可谓春风得意，桌面上的锐龙5000系列老当益壮，不断老树开新花，锐龙7000系列逐渐普及开来，笔记本上的锐龙7040系列也是明星一般......
结合 element -Plus组件库，压缩图片大小，限制图片格式
业务背景：业务上需求满足上传的图片不能太大，但是有时候上传的图片确实超过了限制大小，所以前端这边可以将图片压缩再上传，亦或者是上传给后端接口的图片只能是指定格式，我们前端需要将图片后缀转化，也可以处理！封装的使用方法如下：使用canvas对图片进行压缩处理：/**压缩图片......
2023年度评奖：硬盘篇
2023年可以说是PCIe5.0SSD的真正元年，大量产品开始涌现，也被寄予厚望，但首批产品的表现并不是很理想，主控的功耗发热问题一直没有得到很好的解决，性能释放也不尽如人意，只能期待来年升级。另一方面，PCIe4.0SSD彻底成熟了，1TB以下容量已经基本“消失”，价格也持续走低，两三百元直接到手1......
2023年度评奖：显卡篇
2023年的显卡市场，无论N、A、I哪一家，都是2022年的延续。RTX40系列、RX7000系列都在今年完成了整条产品线的布局，但都到x60系列就停下了，以往的主流级如今竟然成了“入门级”。但是同时，价格却“反向升级”，让众多玩家大呼伤不起，“矿卡”走了却依然很难买到自己心仪的游戏卡。Intel......
2023年度评奖：内存篇
2023年内存市场的主旋律就是高频。仅仅在2年前，主流DDR5内存才还只有4800~5600MHz，而如今6800MHz16GBx2套条已经降到了699元，千元以下的7200MHz也有不少，8000MHz可选型号也不下十数款。回想起酷睿12代发布时DDR5-48008GB高达千元的售价，只能感叹世界变化之快，让人难以预料。至于更......

华为云耀云服务器L实例--Hive的部署

相关文章

赞助商

阅读排行