Greenplum数据库数据分片策略Hash分布——执行器行为

时间：2022-10-09 16:39:51浏览次数：50

标签：执行器 Hash tuple -- Greenplum seg hash econtext

Greenplum数据库Hash分布执行器部分主要涉及Motion、Result和SplictUpdate节点。以使用CdbHash *makeCdbHash(int numsegs, int natts, Oid *hashfuncs)创建一个 CdbHash 结构体、cdbhashinit()执行初始化操作，仅仅是初始化hash初始值、cdbhash()函数会调用hashDatum()针对不同类型做不同的预处理，最后将处理后的列值添加到哈希计算中、cdbhashreduce() 映射哈希值到某个 segment为脉络学习以下执行器对Hash分布的处理。

Motion

只有当Motion类型为MOTIONTYPE_HASH且执行发送任务(MOTIONSTATE_SEND)的后端才可能涉及Hash分布处理（motionstate->mstype == MOTIONSTATE_SEND && node->motionType == MOTIONTYPE_HASH）。也就是说后端进程需要将处理的数据直接发送给其他后端进程，且这个接收后端可以通过分布键数据进行计算哈希值、映射segment后定位到。其执行堆栈为ExecInitNode --> ExecInitMotion --> makeCdbHash。

Greenplum数据库数据分片策略Hash分布——执行器行为_散列表

涉及hash的motion执行流程堆栈如下ExecMotion --> execMotionSender --> doSendTuple --> eval（nodeMotion.c) --> cdbhashinit和cdbhash。调用doSendTuple发送tuple的情况下，当motion类型为MOTIONTYPE_HASH，就需要计算出该segment的index，然后设置到targetRoute变量中。计算的函数就是eval（232, 232, 232); background: rgb(249, 249, 249);">

uint32 eval（ExprContext *econtext, List *hashkeys, CdbHash * h) {
  ListCell   *hk; unsigned int target_seg;
  ResetExprContext(econtext);
  MemoryContext oldContext = MemoryContextSwitchTo(econtext->ecxt_per_tuple_memory); // 切换到ecxt_per_tuple_memory
  
  if (list_length(hashkeys) > 0){ /* If we have 1 or more distribution keys for this relation, hash them. However, If this happens to be a relation with an empty policy (partitioning policy with a NULL distribution key list) then we have no hash key value to feed in, so use cdbhashrandomseg() to pick a segment at random. */
    int      i = 0;
    cdbhashinit(h);
    foreach(hk, hashkeys){
      ExprState  *keyexpr = (ExprState *) lfirst(hk);
      Datum    keyval; bool    isNull;    
      keyval = ExecEvalExpr(keyexpr, econtext, &isNull); /* Get the attribute value of the tuple */      
      cdbhash(h, i + 1, keyval, isNull); /* Compute the hash function */
      i++;
    }
    target_seg = cdbhashreduce(h);
  }else {
    target_seg = cdbhashrandomseg(h->numsegs);
  }
  MemoryContextSwitchTo(oldContext);
  return target_seg;
}

标签：执行器,Hash,tuple,--,Greenplum,seg,hash,econtext
From： https://blog.51cto.com/feishujun/5740687

面试官：Hash 碰撞是什么？如何解决？被问懵了……
Hash如何存数据hash表的本质其实就是数组，hash表中通常存放的是键值对Entry。如下图:这里的学号是个key，哈希表就是根据key值来通过哈希函数计算得到一个值，这个值就是下......
JDK 1.8 HashMap 扩容源码详解
作为开发人员，千万不能停留在实现功能上，一定要提升到性能方面上。这需要我们不断的实践，学习源码，根据底层实现原理，来做出最好的操作。就HashMap而言，一定是我们常用的......
redis的hash数据类型的基本操作
1、首先连上你的redis以下一些命令很简单，或者执行命令后效果也无法体现的就没有进行截图展示2、hash相关操作说明：redis的hash键值对集合，特别适合存储对象，类似于java中......
【Java基础】HashMap集合案例、集合嵌套及统计字符串每个字符出现的次数
目录一、HashMap集合练习：键是String值是Student二、HashMap集合练习：键是Student值是String三、集合嵌套：ArrayList嵌套HashMap四、集合嵌套：Hash......
【Java基础】Set集合、HashSet集合、LinkedHashSet集合的概述和特点及哈希值
目录一、Set集合概述和特点二、哈希值三、HashSet集合的概述和特点HashSet集合保证元素唯一性的原理四、LinkedHashSet集合概述和特点......
Hashicorp Consul Service API远程命令执行漏洞
Preface简介Consul是HashiCorp公司推出的一款开源工具，用于实现分布式系统的服务发现与配置。与其他分布式服务注册与发现的方案相比，Consul提供的方案更为“一站式”。Con......
简述HashSet的扩容机制以及我们在重写equals()的时候为何会重写hashcode()
简述HashSet的扩容机制以及我们在重写equals()的时候为何会重写hashcode() 摘要：在背面试知识点的时候存在这样一条著名的面试题：我们重写equals()的时候为什么要重写has......
Vue Hash模式和History模式
首先，这两个模式都是在单页前端应用下的概念Hash模式的url后面会有一个“#”号（这个看起来会有点奇怪）。当改变#后面的部分是不会去请求后端的，仅在前端进行切换，所以在对一个H......
MyBatis的执行器
Mybatis执行器种类Mybatis的执行器Executor分为三类简单执行器：SimpleExcutor可重用执行器：ReuseExcutor批量执行器：BatchExcutor配置：在Mybatis配置文件中配置执行器......
IPMI v2.0 Password Hash Disclosure漏洞
漏洞描述：远程主机支持IPMIv2.0智能平台，由于支持RMCP+认证密钥交换协议（RAKP）认证，管理接口（IPMI）协议受到信息泄露漏洞的影响。远程攻击者可以通过HMAC从BMC的RAKPmessage2响......

Greenplum数据库数据分片策略Hash分布——执行器行为

Motion

相关文章

赞助商

阅读排行