首页 > 其他分享 >Hive: 一、优化篇

Hive: 一、优化篇

时间:2022-12-16 03:00:21浏览次数:38  
标签:set exec -- 优化 hive Hive true optimize

1.执行参数优化

--分区
SET hive.exec.dynamic.partition=true;
SET hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=10000;
set hive.exec.max.dynamic.partitions=100000;
set hive.exec.max.created.files=150000;
--hive压缩
set hive.exec.compress.intermediate=true;
set hive.exec.compress.output=true;
--写入时压缩生效
set hive.exec.orc.compression.strategy=COMPRESSION;
--分桶
set hive.enforce.bucketing=true;
set hive.enforce.sorting=true;
set hive.optimize.bucketmapjoin = true;
set hive.auto.convert.sortmerge.join=true;
set hive.auto.convert.sortmerge.join.noconditionaltask=true;
--并行执行
set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=8;
--小文件合并
-- set mapred.max.split.size=2147483648;
-- set mapred.min.split.size.per.node=1000000000;
-- set mapred.min.split.size.per.rack=1000000000;
--矢量化查询
set hive.vectorized.execution.enabled=true;
--关联优化器
set hive.optimize.correlation=true;
--读取零拷贝
set hive.exec.orc.zerocopy=true;
--join数据倾斜
set hive.optimize.skewjoin=true;
-- set hive.skewjoin.key=100000;
set hive.optimize.skewjoin.compiletime=true;
set hive.optimize.union.remove=true;
-- group倾斜
set hive.groupby.skewindata=false;

标签:set,exec,--,优化,hive,Hive,true,optimize
From: https://www.cnblogs.com/zi-shuo/p/16986397.html

相关文章

  • JavaScript DOM的性能优化详解
    本身JS操作DOM就比较消耗性能,你可以理解为JS和dom是独立的小岛,用桥实现两者的联系,但桥很窄,要过路费,所以我们要尽最大可能减少过桥的次数。 再加上每次操作DOM都会触发......
  • 秒杀系统优化思路
    秒杀业务为什么难做im系统,例如qq或者微博,每个人都读自己的数据(好友列表、群列表、个人信息);微博系统,每个人读你关注的人的数据,一个人读多个人的数据;   秒杀系统,库存只......
  • Hive与HBase的整合
    开场白:Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive_hbase-handler.jar工具类(​​HiveStorageHandlers​​),大致意思......
  • MySQL查询性能优化七种武器之索引下推
    ​​MySQL查询性能优化七种武器之索引潜水​​​​MySQL查询性能优化七种武器之链路追踪​​今天要讲的是MySQL的另一种查询性能优化方式— 索引下推(IndexConditionPush......
  • 大型网站和小型网站在优化上的策略有什么区别
    在网络发达的今天,越来越多的企业会选择建立网站,网站可以给企业带来客户,产生经济效益。往往一些大型企业或者专业的电子商务公司会选择一些大型网站,而规模较小的企业会选择小......
  • 关于切换场景加载耗时的优化问题
    1)关于切换场景加载耗时的优化问题​2)SpriteAtlas打包AssetBundle后运行时内存大小和什么有关系3)手机上使用MRT的限制和兼容性4)如何控制粒子系统组件数量的上限这是第317......
  • SQL优化篇之-如何减少耗时查询的调用次数
    背景在查询语句中,如果Select子句中,调用较为耗时的函数或子查询,比较各种SQL语句的编写方案,得出其中最优选择。一、数据准备,SQL语句模拟较耗时的用户函数或子查询......
  • 时序预测 | MATLAB实现贝叶斯优化CNN-LSTM时间序列预测(股票价格预测)
    时序预测|MATLAB实现贝叶斯优化CNN-LSTM时间序列预测(股票价格预测)目录​​时序预测|MATLAB实现贝叶斯优化CNN-LSTM时间序列预测(股票价格预测)​​​​效果一览​​​......
  • 回归预测 | MATLAB实现WOA-GRU鲸鱼算法优化门控循环单元多输入单输出回归预测
    回归预测|MATLAB实现WOA-GRU鲸鱼算法优化门控循环单元多输入单输出回归预测目录​​回归预测|MATLAB实现WOA-GRU鲸鱼算法优化门控循环单元多输入单输出回归预测​​​​......
  • 回归预测 | MATLAB实现WOA-BiLSTM鲸鱼算法优化双向长短期记忆神经网络多输入单输出回
    回归预测|MATLAB实现WOA-BiLSTM鲸鱼算法优化双向长短期记忆神经网络多输入单输出回归预测目录​​回归预测|MATLAB实现WOA-BiLSTM鲸鱼算法优化双向长短期记忆神经网络多......