首页 > 其他分享 >【维度建模】【第二章】Kimball维度建模技术概述

【维度建模】【第二章】Kimball维度建模技术概述

时间:2024-06-05 15:23:51浏览次数:21  
标签:Kimball 建模 粒度 维度 2.2 2.1 事实 度量

2.1基本概念

2.1.2维度建模研讨

维度模型应该由业务、模型设计者通过充分的讨论得到。

2.1.3四步骤维度设计过程

维度设计期间主要设计一下四个主要的决策:

  • 选择业务过程
  • 声明粒度
  • 确认维度
  • 确认事实

2.1.4业务过程

表示一次业务的行为。例如获得订单、学生课程注册,

2.1.5粒度

粒度是确定事实表中一行代表什么,原子粒度是最低级别的粒度,通常建议使用原子级别粒度,这样的数据可以承受无法预测的用户查询。

轻度汇总的粒度对性能调整来说非常重要,但这样的粒度往往需要考虑业务的公共问题是什么,

2.1.6维度

维度表包含BI应用所需要的用于过滤及分类事实的描述性属性。

 

2.2事实表技术基础

2.2.1事实表结构

发生在现实生活中的操作型事件,其产生的可度量的值存储在事实表中。因此事实表的结构完全依赖于物理活动。除了数字类型的度量外通常还包含外键用于与维度表进行关联。

查询请求的主要目标是基于事实表开展计算和聚合操作。

2.2.2可加、半可加、不可加事实

事实表中的数字度量可以分为三种类型:

  • 完全可加:可以按照事实表关联的任意维度进行汇总,例如:消费金额,一次地理位置上报。
  • 部分可加:仅能对某些维度进行汇总,例如:订单差额。
  • 不可加:例如,比率。

    对与不可加事实,尽量存储组成这些不可加事实的完全可加分量。比如比率,就存储构成结果比率的分子与分母。

2.2.4一致性事实

如果某些度量出现在不同的事实表,需要注意,如果需要比较或计算不同事实表中的事实,应该保证对这些度量的技术定义是相同。

如果不同事实表的定义是一致的,则这些事实表应该具有相同的命名,反之应该拥有不同的命名用以区分。

2.2.6周期性快照事实表

周期性快照事实表中,每一行汇总了发生在某一周期(天、周、月)的多个度量事件。

粒度是周期的,不是个体的事务。

2.2.7累积快照事实表

累积事实表的行汇总了发生在过程开始和结束之间可预测步骤内的度量事件。

2.2.8无事实的事实表

尽管多数度量事件获取的结果是数字化的,但也存在某些事件仅仅记录某一时刻一系列多维信息。例如某天,某人,在某地,参加了某人的xxx活动。

2.2.9聚合事实表

对一个或多个原子粒度的事实表进行轻度聚合得到的事实表。目的是为了提高查询性能。

2.2.10合并事实表

将来自多个过程的,以相同粒度表示的事实合并为一个单一的事实表。

类似于我们理解的宽表,例如将用户表+产品表+购买记录表合并为一个具有更多字段的宽表,这样做能够带来方便。

 

标签:Kimball,建模,粒度,维度,2.2,2.1,事实,度量
From: https://www.cnblogs.com/mark-blogs/p/18231605

相关文章

  • 数据治理--数据处理,数据仓库 数仓分层,数据建模流程 数仓设计规范
                           ......
  • EFDC建模方法及在地表水环境评价、水源地划分、排污口论证技术教程
    原文链接:EFDC建模方法及在地表水环境评价、水源地划分、排污口论证技术教程https://mp.weixin.qq.com/s?__biz=MzUzNTczMDMxMg==&mid=2247605969&idx=3&sn=30087fd54f3f7a799423af2af789735a&chksm=fa821f36cdf59620bb55495293987726bfa59dcf0bdbab1212fd7cda48ed1aee24785d9a9......
  • 【高质量】2024数学建模国赛E题高质量代码+思路(点个关注,后续会更新)
    您的点赞收藏是我继续更新的最大动力!一定要点击如下的卡片链接,那是获取资料的入口!点击链接加入群聊【2024国赛资料合集】:http://qm.qq.com/cgi-bin/qm/qr?_wv=1027&k=tvWLj22l8fsRZPV1zKOwfcihPex9VNXi&authKey=dHAIZyRWUaLsvrRpqr0KxbF7gslsivHrAA1dQQ04dycSAZOyzrALr7scpfs......
  • 混合高斯背景减除算法实现背景建模
     本代码将实现视频中的背景和前景分离,并定位行人。1.实现效果以下为处理后的视频截图2.定义卷积核importcv2cap=cv2.VideoCapture('test.avi')kernel=cv2.getStructuringElement(cv2.MORPH_CROSS,(3,3))#kernel:[[010],[111],[010]]#定义一个3*3的......
  • 【维度建模】维度建模简介
    维度建模的简介维度模型通常不要求必须满足数据库的3NF,规范化的3NF对与数据仓库来说过于复杂,用户难以理解、检索。但维度模型包含的信息和3NF模型包含的信息基本一致,但为了查询性能的通常刻意不满足三范式。1.3.1 星型模型与OLAP关系数据库中实现的维度模型称......
  • R语言GARCH-DCC模型和DCC(MVT)建模估计
    原文链接:http://tecdat.cn/?p=7194原文出处:拓端数据部落公众号 这个简短的演示说明了使用r软件包的DCC模型及其方法的使用,尤其是在存在MVT分布形状参数的情况下进行2级DCC估计的另一种方法。第一阶段并将其传递给dccfit  cl=makePSOCKcluster(10)multf=multi......
  • 【高质量】2024数学建模国赛B题保奖思路分享(点个关注,后续会更新)
    您的点赞收藏是我继续更新的最大动力!一定要点击如下的卡片链接,那是获取资料的入口!点击链接加入群聊【2024国赛资料合集】:http://qm.qq.com/cgi-bin/qm/qr?_wv=1027&k=ETW_x4lYO3NoBaDWS48v_PP_8IbE-iaZ&authKey=58GwIb%2BSZ6ZBvEqN3PKw964UkZPTcLP2bCd5qOIgKEQMltIfrA43wjkZU......
  • 探索气象数据的多维度三维可视化:PM2.5、风速与高度分析
    探索气象数据的多维度可视化:PM2.5、风速与高度分析摘要在现代气象学中,数据可视化是理解复杂气象模式和趋势的关键工具。本文将介绍一种先进的数据可视化技术,它能够将PM2.5浓度、风速和高度等多维度数据以直观和动态的方式展现出来。一、视角与复位气象数据可视化首先需......
  • OR-Tools CP-SAT:如何为动态能力和任务建模
    我正在处理作业车间调度问题,其中我有一些定义为时间间隔变量的任务:IntervalVartaskInterval=model.NewIntervalVar(start,duration,end,$"interval_{task.WorkOrder_Id}_{task.TaskId}");每个任务都可以在某个工作站上完成,每个工作站都有自己的日历。List<UserCalendarsDTO>......
  • 【科普向】【文末附gpt升级秘笈】《庆余年》凤冠之工艺探究——Blender建模与3D打印之
    《庆余年》凤冠之工艺探究——Blender建模与3D打印之奥秘一、引言昔者,《庆余年》之热播,引发天下观众之热议。今者,其续作《庆余年2》之中,一场盛大的婚礼更是瞩目。而此婚礼之上,唯一之凤冠,竟出自一款名为Blender之软件之手,辅以3D打印之技术,成就其非凡之美。夫此软件,诞生于三十......