- 2024-10-26数据仓库分层解析
目录一、数据仓库为什么要分层二、数据仓库怎么分层1、ODS(OperationalDataStore):数据源层2、DW(DataWarehouse): 数据仓库层2.1、DWD(DataWarehouseDetail):数据明细层2.2、DWM(DataWareHouseMidddle):数据中间层2.3、DWS(DataWareHouseService):数据服务层3、ADS(Applica
- 2024-10-14Navicat Premium 17.1.3版本发布,原生支持华为云数据仓库GaussDB(DWS)
近日,Navicat发布了一项重要更新,原生支持华为云数据仓库GaussDB(DWS)。这是Navicat支持的国内首个数据仓库产品,将为广大GaussDB(DWS)用户带来更多的便利。Navicat无缝对接GaussDB(DWS),让数据仓库的构建、查询、优化及维护变得更加直观和易于管理,助力企业轻松驾驭大数据时代的
- 2024-09-12技术揭秘 DWS 实时数仓解决方案,如何深度融合 Flink 简化数据链路
一、实时数仓介绍实时数仓是一种现代化的数据仓库系统,其核心优势在于能够处理和分析实时数据。随着信息技术和数据科学的飞速发展,企业对实时数据分析和决策支持的需求愈发迫切。实时数仓能够实时或近实时地反映数据变化,为企业提供最新的业务指标和深度洞察,从而支持快速决策。因此
- 2024-09-12技术揭秘 DWS 实时数仓解决方案,如何深度融合 Flink 简化数据链路
摘要:DWS实时数仓解决方案支持数仓模型的分层和增量加工,能够实现数据的实时入库、出库和查询,确保数据的新鲜度。一、实时数仓介绍实时数仓是一种现代化的数据仓库系统,其核心优势在于能够处理和分析实时数据。随着信息技术和数据科学的飞速发展,企业对实时数据分析和决策支持的需求愈
- 2024-09-05数仓建模:如何有效构建DWB/DWM层? | 基于案例实战分析
目录0为什么要构建DWB层?1DWB层功能及定义2DWB/DWM层如何实现?3项目案例实战3.1案例1:订单明细事实宽表构建3.2案例2:工单事实表指标分析4小结0为什么要构建DWB层?该层可以理解为DWS层逻辑的优化和沉淀,如果直接放到DWS层则会使得DWS层变得代码逻辑很复杂,不好维
- 2024-09-02DWS(PG)自定义函数查询表注释 ,表结构
createorreplacefunctionshow_table(tableNamevarchar2)returnstable(table_namevarchar2,column_namevarchar2,column_typevarchar2,attnotnullvarchar2,column_commentvarchar2)as$$begin returnquerySELECTc.relname::varchar2astable_name,
- 2024-08-25DWS(GAUSSDB)函数返回结果集(表)
-----------建表------------droptableifexistsemployees;CREATETABLEemployees(employee_idNUMBER(10)PRIMARYKEY,--EmployeeID,primarykeyfirst_nameVARCHAR2(50),--Employee'sfirstnamelast_nameVARCHAR2(50),--Employee'slastna
- 2024-08-08Flink 实时数仓(十)【DWS 层搭建(四)交易域汇总表创建】
前言 今天完成DWS层交易域剩下的两个指标,估计一早上就完了,这两个需求用到的知识点和昨天的需求差不多;1、交易域省份粒度下单各窗口汇总表1.1、思路分析 这个需求是比较简单的,province_id字段是订单表中的字段,在DWD层的下单事务事实表中我们
- 2024-08-07最佳实践:解读GaussDB(DWS) 统计信息自动收集方案
摘要:现在商用优化器大多都是基于统计信息进行查询代价评估,因此统计信息是否实时且准确对查询影响很大,特别是分布式数据库场景。本文详细介绍GaussDB(DWS)如何实现了一种轻量、实时、准确的统计信息自动收集方案。本文分享自华为云社区《【最佳实践】GaussDB(DWS)统计信息自动收
- 2024-08-01数仓分层ODS、DWD、DWM、DWS、DIM、DM、ADS
往期推荐数仓入门:数据分析模型、数仓建模、离线实时数仓、Lambda、Kappa、湖仓一体-CSDN博客数仓常见名词解析和名词之间的关系-CSDN博客数据仓库及数仓架构概述-CSDN博客大数据HBase图文简介-CSDN博客目录1.数仓分层 1.1数据源层:ODS(OperationalDataStore)1.2数
- 2024-07-08开源数据库Greenplu突然闭源?GaussDB(DWS)提供数仓新可能
本文分享自华为云社区《开源数据库Greenplum人去楼空?GaussDB(DWS)提供数仓新可能》,作者:起个名字11111。近日Greenplum关闭GitHub源码事件在数仓行业广受关注,代码业界纷纷猜测Greenplum即将闭源。作为一款典型的OLAP数据库,Greenplum的闭源势必带来数仓市场格局的调整与变化。国
- 2024-07-04GaussDB(DWS)性能调优,解决DM区大内存占用问题
本文分享自华为云社区《GaussDB(DWS)性能调优:DM区优化案例——维度表关联条件存在会计期》,作者:O泡果奶~。当前DM(P1、P3、CBGDM)存在维度表与主表关联时使用会计期作为关联条件,会导致出现大内存占用或未识别数据倾斜的问题【场景一】f.period_id=维度表.period_id1.1、【问题
- 2024-06-06项目部署
项目打包mvncleaninstall配置nginx安装:https://blog.csdn.net/qq_59125846/article/details/136401534修改配置文件nginx.conf(nginx/conf目录下):#API接口配置:server{server_namedwsapi.gzvast.com;listen80;location/{proxy_set_header
- 2024-05-223/5数仓面试必看
压缩就用gzip 汇总数据 TSV 建表语句 全量表设计 null的格式不一样,虽然显示都为空 都用空字符显示增量表13张和业务无关的不用拿过来 ods数据装载脚本 i:4substring方法DIM表的数据源是ods层如果找不到不能从数
- 2024-05-11详解GaussDB(DWS)中的行执行引擎
本文分享自华为云社区《GaussDB(DWS)行执行引擎详解》,作者:yd_227398895。1.前言GaussDB(DWS)包含三大引擎,一是SQL执行引擎,用来解析用户输入的SQL语句,生成执行计划,供执行引擎来执行;二是执行引擎,其中包含了行执行引擎和列执行引擎,执行引擎即查询的执行者,位于优化器和存储引擎之间,负
- 2024-04-28数仓(十八)数仓建模以及分层总结(ODS、DIM、DWD、DWS、DWT、ADS层)
通过前面内容分享,我们讲解了数仓建模的概念、理论、OLTP、OLAP、以及ODS、DIM、DWD、DWS、DWT、ADS层简单搭建。涉及的内容非常多,这节我们捋一捋数仓建模的步骤、以及数仓分层思路、五层每层的设计、处理、加载等总结一下。一、建模步骤 1、关于数仓的建模有两种基本的模型:
- 2024-04-18GaussDB(DWS)基于Flink的实时数仓构建
本文分享自华为云社区《GaussDB(DWS)基于Flink的实时数仓构建》,作者:胡辣汤。大数据时代,厂商对实时数据分析的诉求越来越强烈,数据分析时效从T+1时效趋向于T+0时效,为了给客户提供极速分析查询能力,华为云数仓GaussDB(DWS)基于流处理框架Flink实现了实时数仓构建。在本期《GaussDB(DW
- 2024-04-07数仓调优实战:GUC参数调优
本文分享自华为云社区《GaussDB(DWS)性能调优系列实战篇七:十八般武艺之GUC参数调优》,作者:黎明的风。1.前言适用版本:【8.1.1及以上】GaussDB(DWS)性能调优系列专题文章,介绍了数据库性能调优的思路和总体策略。在系统级调优中数据库全局的GUC参数对整体性能的提升至关重要,而
- 2024-04-05离线数仓(九)【DWS 层开发】
前言 上一个DWD层用了半个月时间,但是慢有慢的好处;今天开始DWS层的学习,目标是4月初把项目完成,完了赶紧从头回顾一遍项目。 今天操场跑了20分钟,顺便在这里记录一下,现在每周只有没早八的时候能跑一下了,近一年没有好好跑步了,这个习惯应该找回来了
- 2024-04-03解密数仓的SQL ON ANYWHERE技术
本文分享自华为云社区《GaussDBDWS的SQLONANYWHERE技术解密》,作者:tooooooooooomy。1.前言适用版本:【8.1.1(及以上)】查询分析是大数据要解决的核心问题之一,虽然大数据相关的处理引擎组件种类繁多,并提供了丰富的接口供用户使用,但相对传统数据库用户来说,SQL语言依然是使用最
- 2024-04-01探索GaussDB(DWS)湖仓融合:Hudi与元数据打通的深度解析
华为云数仓GaussDB(DWS)研发专家高若岳老师,深入解析GaussDB(DWS)数据仓库如何与大数据生态快速对接。随着智能数据时代的到来,数据量爆发式增长,数据形态呈海量化和多样化发展,不再是单一的结构化数据。从海量和多样化的数据做融合分析,创造更多业务价值的诉求日益强烈。在本期《Ga
- 2024-03-29cgroup、资源池、用户的关系..涉及到GaussDB(DWS)的资源设置
本文分享自华为云社区《GaussDB(DWS)的cgroup、资源池、用户的关系》,作者:nullptr_。1.前言本文主要展示了DWS中cgroup、资源池、用户之间的关系,从而对DWS的资源设置情况有个初步了解。2.相关对象创建脚本gs_ssh-c"gs_cgroup-cSClassN1-Gwn1"gs_ssh-c"gs_cgroup-
- 2024-03-25GaussDB(DWS) 业务高可靠的三大利器:CN RETRY、远程读、ELB
本文分享自华为云社区《GaussDB(DWS)业务高可靠原理》,作者:yd_291396996。1.前言适用版本:【8.1.0及以上】GaussDB(DWS)所有内部组件CN、DN、GTM、CM等采用多活或主备设计,通过集群管理进行故障检测和切换,保证了单点故障场景下业务的可靠性。此外还采用了CNRETRY、远程读、ELB
- 2024-03-18详解GaussDB(DWS)中3个防过载检查项
本文分享自华为云社区《【防过载检查项】》,作者:譡里个檔。1.GUC参数检查目的:针对不同版本建议设定不同的参数值,当前先检查出来,后续diagnosis会给出建议值SELECTsplit_part((substring(version()from'\((.*)\)')),'',2)ASversion,(EXISTS(SELECT1FROM(S
- 2024-03-12Libcomm通信库:GaussDB(DWS) 为解决建联过多的小妙招
本文分享自华为云社区《GaussDB(DWS)集群通信系列三:Libcomm通信库》,作者:半岛里有个小铁盒。1.前言适用版本:【8.1.0(及以上)】在大规模集群、高并发业务下,如果有1000DN集群,每个stream线程需要建立1000个连接。如果1000stream并发,DN总共需要建立100万个连接,会消耗大量的连接、