首页 > 其他分享 >数据仓库之星型模型和雪花模型

数据仓库之星型模型和雪花模型

时间:2023-12-19 16:46:28浏览次数:27  
标签:模型 数据仓库 雪花 星型 维表 维度 事实

在了解星型模型和雪花模型之前,我们需要先了解一下事实表和维度表到底是什么?

一、事实表与维度表

事实表

  • 在数据仓库中,保存度量值的详细值或存储事实记录的表称为事实表。事实数据表通常包含大量的行。
  • 事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据。事实表的粒度决定了数据仓库中数据的详细程度。
  • 常见事实表:订单事实表
  • 事实表的特点:表多(各种各样的事实表);数据量大
  • 事实表根据数据的粒度可以分为:事务事实表、周期快照事实表、累计快照事实表

常见的事实表有:订单表,销售事实表、库存事实表等。销售事实表包含销售数量、销售单价、销售总额、利润等指标,库存事实表包含库存数量、入库数量、出库数量等指标

维度表

  • 维度表(维表)可以看作是用来分析数据的角度,纬度表中包含事实数据表中事实记录的特性。有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息。
  • 常见维度表:时间维度、地域维度、商品维度
  • 总结:事实表是关注的内容(如:销售额、销售量),维表是观察事务的角度。

常见的维度表有:日期维表(存储与日期对应的周、月、季度等属性)、地区维表(包含国家、省/州、城市等属性)、商品维表等。

二、星型模型和雪花模型

星型模型

  1. 星型模是一种多维的数据关系,它由一个事实表和一组维表组成;
  2. 事实表在中心,周围围绕地连接着维表;
  3. 事实表中包含了大量数据,没有数据冗余;
  4. 维表是逆规范化的,包含一定的数据冗余;

雪花模型

  1. 雪花模式是星型模型的变种,维表是规范化的,模型类似雪花的形状;特点:雪花型结构去除了数据冗余。
  2. 星型模型存在数据冗余,所以在查询统计时只需要做少量的表连接,查询效率高;
  3. 星型模型不考虑维表正规化的因素,设计、实现容易;星型模型不考虑维表正规化的因素,设计、实现容易;

 

标签:模型,数据仓库,雪花,星型,维表,维度,事实
From: https://www.cnblogs.com/sx66/p/17914128.html

相关文章

  • 超越巨头:Zephyr-7B领跑7B级模型竞赛,开源且笔记本可运行
    引言在AI界的大语言模型(LLM)竞赛中,Zephyr-7B作为HuggingFaceH4团队的最新力作,展现了令人瞩目的技术突破。它不仅性能超越了700亿参数的LLaMA2模型,更引人注目的是,这一开源模型可在常规笔记本电脑上运行,极大地提高了AI技术的可达性。技术背景Zephyr-7B基于MistralAI的开源大模型Mis......
  • 大语言模型训练数据常见的4种处理方法
    本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者:码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023年9月为止,还没有非常好的大模型的理论分析......
  • 手绘风格3D游戏场景模型纹理贴图
    在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.jsAI自动纹理开发包 - YOLO虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎当谈到游戏角色的3D模型风格时,有几种不同的风格:写实风格:这种风格追求高度真实......
  • 手绘风格人物3D模型纹理贴图
    在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.jsAI自动纹理开发包 - YOLO虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎当谈到游戏角色的3D模型风格时,有几种不同的风格:写实风格:这种风格追求高度真实......
  • 低多边形3D卡通植物模型纹理贴图
    在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.jsAI自动纹理开发包 - YOLO虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎当谈到游戏角色的3D模型风格时,有几种不同的风格:写实风格:这种风格追求高度真实......
  • 写实风格3D植物模型纹理贴图
    在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.jsAI自动纹理开发包 - YOLO虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎当谈到游戏角色的3D模型风格时,有几种不同的风格:写实风格:这种风格追求高度真实......
  • 三维模型的顶层合并构建中纹理色彩匀色技术方法分析
    三维模型的顶层合并构建中纹理色彩匀色技术方法分析 多块相邻倾斜摄影三维模型的顶层合并构建中,纹理色彩匀色技术是一种常用的方法,可以使不同块之间的纹理色彩更加一致和连贯。本文将对这种技术进行浅谈。在多块相邻倾斜摄影三维模型的顶层合并构建过程中,由于不同块之间的光......
  • R语言离散时间马尔可夫链(Markov chain)模型分类案例可视化分析
    全文链接:https://tecdat.cn/?p=34576原文出处:拓端数据部落公众号有许多用于马尔可夫链的复杂应用。这些包括用于将多态模型拟合为面板数据的msm和SemiMarkov,用于生存分析应用的mstate,用于估计3状态进行性疾病模型的转移概率的TPmsm,用于将马尔科夫模型应用于健康护理经济应用的he......
  • 文档理解的新时代:LayOutLM模型的全方位解读
    一、引言在现代文档处理和信息提取领域,机器学习模型的作用日益凸显。特别是在自然语言处理(NLP)技术快速发展的背景下,如何让机器更加精准地理解和处理复杂文档成为了一个挑战。文档不仅包含文本信息,还包括布局、图像等非文本元素,这些元素在传递信息时起着至关重要的作用。传统的NLP......
  • 文档理解的新时代:LayOutLM模型的全方位解读
    一、引言在现代文档处理和信息提取领域,机器学习模型的作用日益凸显。特别是在自然语言处理(NLP)技术快速发展的背景下,如何让机器更加精准地理解和处理复杂文档成为了一个挑战。文档不仅包含文本信息,还包括布局、图像等非文本元素,这些元素在传递信息时起着至关重要的作用。传统的NLP......