• 2024-09-30HIVE优化系列之数据倾斜
    数据倾斜在hive表中进行一系列join关联时经常会出现数据倾斜问题,可以通过hint将小表进行广播,从而提高查询的执行效率。第一种hint方法:/*+BROADCAST(small_table)*/SELECT/*+BROADCAST(small_table)*/*FROMlarge_tableJOINsmall_tableONlarge_table.id=s
  • 2024-06-04如何理解mysql小表驱动大表
    就像自行车爬坡一样么,小齿轮驱动大齿轮MySQL采用“小表驱动大表”的策略,确实在某种程度上类似于自行车爬坡时小齿轮驱动大齿轮的原理,目的都是为了更高效地利用有限的资源达到目标。在数据库查询的上下文中,这个策略背后的逻辑可以这样理解:1.**效率最大化**:小表数据量少,遍历小
  • 2024-04-02【Cache】将常用的“小表”缓存到Buffer Cache
    对于那些被经常以全表扫描访问获取数据的“小表”来说,为了提升性能可以考虑将这些表cache在BufferCache中。什么样的表可以称其为“小表”呢?例如经常被访问的参数表,此类表通常包含的数据量并不大,经常以全表扫描的访问形式对其进行访问。如果不强制将这些表cache在BufferCache中,
  • 2024-02-07MySQL优化
    优化分为六大部分:SQL语句的优化索引的优化表结构的优化事务优化系统配置优化物理机的优化SQL语句的优化a.尽量使用select字段名,不要使用select*,select*不能使用索引覆盖。只查需要用到的列。b.小表驱动大表。主查询in/exists子查询.ⅰ.in先执行右边的子查询
  • 2023-11-03mysql sql常用优化
    1 explain输出执行计划,检查orderby和where后边的字段是否建立索引2in()中的列不应过多,notin和in()数据过多都不再走索引,使用全表扫描,连续数值可以使用between1and33select后边指定字段,少用select(*)4 where子句中避免isnull/isnotnull5 应尽量避免在whe
  • 2023-05-06HiveSQL调优-最常用的调优方式
    系统和其它层面:让经常where的字段进行分区,合理的多分桶、数据使用压缩、建宽表的时候用列式的orc存储、开启严格模式:会产生笛卡尔积、orderby排序后未加limit、查询分区表时未指定列的HiveSQL语句直接执行出错开启列裁剪和分区裁剪:即只查询要读取的列和分区,避免全表扫描或全列
  • 2023-04-03C语言逆向——switch语句中的大表和小表,本质上是内在存储空间降低
    连续值中抹去多项CPP代码:#include"stdafx.h"voidFun(intx){ switch(x){ case100: printf("100"); break; case101: printf("101"); break; case102: printf("102"); break; case106: printf("
  • 2023-02-28sql优化方法
    1.避免使用select*2.小表驱动大表(in前面大表,后面小表;exists前面小表,后面大表)3.连接查询代替子查询4.join的表不宜过多(根据阿里巴巴规范,join的表数量不应超过3个)5.选
  • 2023-02-18mysq联表查询优化:小表驱动大表
     --todo   https://blog.csdn.net/zy_whynot/article/details/121608851?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Ede
  • 2023-01-18NL连接一定是小表驱动大表效率高吗
    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。作者:JennyYu文章来源:GreatSQL社区原创前
  • 2022-12-01[15-445]Join Algorithms memo (Join 为什么要用小表做驱动表)
    NestedLoopJoin这一章节主要讲解join的算法,我想记录一些重点的地方。有趣的是关于NestedLoopjoin对驱动表为什么小表会更好这个问题,搜遍简中的blog都是一些错
  • 2022-11-17SqlServer 优化的技巧
    1、避免使用select*select*不会走覆盖索引,会出现大量的回表操作,从而导致SQL的查询性能很低    2、用unionall代替union1、使用union后,可以获取排重
  • 2022-09-21MapJoin与小表驱动大表
    SQL常说用小表驱动大表,网上很多帖子也是说hive也是小表驱动大表。  但实际用expalin执行计划测的时候,大表写在前面执行了mapjoin,小表写前面反而没采用MapJoin,为了确
  • 2022-08-25tidb 小表缓存
    TiDB在v6.0.0版本中引入了缓存表功能。该功能适用于频繁被访问且很少被修改的热点小表,即把整张表的数据加载到TiDB服务器的内存中,直接从内存中获取表数据,避免从TiKV