openGauss- 资源池化多机并行

可获得性

本特性自openGauss 6.0.0-RC1 版本开始引入。

特性简介

SPQ（SharedEverything Parallel Query）是在openGauss开源数据库上的一个多机并行查询框架，该框架部署在资源池化场景内，该场景下集群部署的为一写多读架构，集群下存在一个写/读节点和多个读节点，现有openGauss集群只存在同时一个读节点查询的能力，集群的查询性能非常受限。SPQ基于SharedEverything分布式架构，所有节点都共享集群内的资源，优化器首先生成多机执行计划，之后计划通过分发到各节点执行，再由查询节点汇聚各节点数据实现所有读节点并行查询，充分发挥集群的OLAP能力。使资源池化同时具备较强的TP和AP能力。

图 1 资源池化多机并行方案

客户价值

客户在读节点执行大规模数据查询时实际上使用的是当前查询节点的算力，其余节点算力没有被有效利用起来。多机并行可以充分利用所有计算节点算力从而大幅提升查询效率。

特性描述

openGauss资源池化一写多读架构通过构建虚拟Node-Group将OLTP业务和OLAP业务隔离，任一个节点均可以发起查询SQL请求。根据代价和规则决定采用多机查询或者原生单机查询，对上层应用透明，用户无感知。为实现上述需求，SPQ在openGauss原有设计基础上，研发以下几项新特性功能：

对接开源ORCA优化器，生成SPQ多机并行执行计划，适配后的组件以动态库模式加载至openGauss内核。
新增基础扫描算子、计算算子适配多机计划，实现节点间数据交互与数据分发。
新增自适应扫描机制消除数据倾斜问题。
支持DML、DDL增强。

1. 对接分布式优化器

使用GreenPlum社区研发的开源组件GPORCA优化器，对其适配openGauss生成多机执行计划，适配后的组件以动态库的方式被openGauss多机查询调用。由于ORCA本身已模块化，输入、输出均接口化，在适配时，我们仅对下图蓝框部分做相应适配逻辑，核心改动包含：

针对资源池化存储特性，扩展扫描节点生成方案，调整表数据扫描范围。
在共享存储基础上，匹配相应代价模型，生成分布式扫描计划。

图 2 openGauss对接ORCA

2. 多机并行执行框架

节点逻辑适配：通过适配现有openGauss分布式执行流程，在资源池化集群中引入QC(Query Coordinator) 与 QE(Query Executor) 的逻辑概念，匹配CN/DN角色。且集群任一节点发起查询请求均可成为QC， QE也可通过GUC参数动态配置。

图 3 SPQ工作集群

自适应扫描：SPQ设计实现自适应扫描机制，不再限定每个Worker扫描特定的ID。采用请求-响应(Request-Response)模式，通过QC进程与QE Worker进程间的特定RPC通信机制，由QC进程负责告知每个Worker进程可执行的扫描任务，从而消除计算数据倾斜的问题。

图 4 自适应扫描

基础算子支持： SPQ多机并行执行器对原有基础算子(Scan,Join,Aggregate,Sort等)及Stream类算子（Gather/Broadcast/Redistribute）的并行化提供支持。在原有算子的实现基础上，为确保节点间数据的切分读取及执行过程完整适配ORCA生成的分布式执行计划，新增/修改以下算子：

扫描类算子：新增SpqSeqScan、SpqIndexScan、SpqIndexOnlyScan、SpqBitmapHeapScan四类算子，适配分布式扫描范围。
计算类算子：新增Aggregate分布式FinalAgg、PartialAgg计算逻辑。HashJoin算子支持Orca生成的LASJ_NOTIN semi-join分支。
Shuffle类算子：新增SpqRemoteQuery、Redistribute算子，适配分布式计划。

图 5 TPC-H性能对比数据