首页 > 其他分享 >数据治理之各类数据概念

数据治理之各类数据概念

时间:2023-05-20 11:23:22浏览次数:34  
标签:质量 数据 指标 数据管理 用于 治理 Data 各类

  1. 元数据(Metadata):元数据是关于数据的数据,用于描述、管理和组织其他数据。元数据可以包括:数据的来源、创建时间、格式、数据质量等信息。元数据有助于数据治理过程中的数据分类、数据质量管理和数据安全性。

  2. 主数据(Master Data):主数据是描述核心业务实体的关键数据,如客户、产品、供应商等。主数据通常在整个企业中共享,作为业务流程的基础。主数据管理(MDM)是确保主数据质量、一致性和准确性的过程。

  3. 基础数据(Reference Data):基础数据是用于分类和标准化其他数据的数据。它通常包括代码表、标准列表和分类。基础数据管理有助于确保数据的一致性和准确性,从而提高数据质量。

  4. 指标数据(Metric Data):指标数据是用于衡量业务绩效、数据质量和其他关键指标的数据。指标数据可以包括销售额、客户满意度、数据准确性等。通过监控和分析指标数据,可以发现问题并采取改进措施。

  5. 事务数据(Transactional Data):事务数据是描述业务活动的详细数据,如订单、发票、付款等。事务数据通常用于支持业务流程和分析。

  6. 分析数据(Analytical Data):分析数据是为了支持决策制定而进行数据分析和报告的数据。分析数据通常包括历史数据、汇总数据和预测数据。分析数据可以帮助企业发现趋势、模式和关联,从而制定更好的决策。

这些数据概念之间的区别和联系如下:

  • 元数据是描述其他数据的数据,包括主数据、基础数据、指标数据等。元数据有助于数据治理过程中的数据分类、数据质量管理和数据安全性。
  • 主数据和基础数据都是用于支持业务流程的关键数据。主数据描述核心业务实体,基础数据用于分类和标准化其他数据。主数据管理和基础数据管理都是确保数据质量和一致性的重要过程。
  • 指标数据、事务数据和分析数据都是用于衡量和改进业务绩效的数据。指标数据用于衡量关键指标,事务数据描述业务活动,分析数据用于支持决策制定。

标签:质量,数据,指标,数据管理,用于,治理,Data,各类
From: https://www.cnblogs.com/itfriend/p/17416932.html

相关文章

  • 视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数
    最近我们被客户要求撰写关于复杂网络分析的研究报告,包括一些图形和统计输出。复杂网络分析研究如何识别、描述、可视化和分析复杂网络。为了用R来处理网络数据,我们使用婚礼数据集CNA研究和应用爆炸式增长的突出原因是两个因素-一个是廉价而强大的计算机的可用性,使在数学、物理......
  • 使用ssm框架出现数据库连接问题
    java.sql.SQLException:Accessdeniedforuser'jdbc:mysql://localhost:3306/oa?useSSL=false&allo'@'localhost'(usingpassword:YES)或者是PublicKeyRetrievalisnotallowed查阅资料发现当publicKeyRetrievalisnotAllowed错误解决或依然会出现数据连接失败问......
  • 【爬虫数据集】李子柒YouTube频道TOP10热门视频的TOP2000热门评论,共计2W条
    目录一、背景二、爬取目标三、结果展示四、演示视频五、附完整数据一、背景这段时间,有超多小伙伴找我要YouTube数据,做数据分析、情感分析之类的研究工作,但很多人并不是计算机软件相关专业,不具备爬虫开发技术,但又有数据需求,可能是新闻传播学、社会学等相关学科,旨在分析社会热点现......
  • 经常搞不清楚的几个数据类型
    1、什么是浮点数?之前我们学习了定点数,其中「定点」指的是约定小数点位置固定不变。那浮点数的「浮点」就是指,其小数点的位置是可以是漂浮不定的。这怎么理解呢?其实,浮点数是采用科学计数法的方式来表示的,例如十进制小数8.345,用科学计数法表示,可以有多种方式:8.345=8.345*1......
  • 数据结构!
    AT_joisc2014_c 歴史の研究该起床了。该起床了。该起床了。该起床了。该起床了。本题删除会改变最大值,十分麻烦,所以使用回滚莫队即可。该起床了。该起床了。该起床了。该起床了。该起床了。P3245 [HNOI2016]大数考虑如何提取区间\([l,r]\)组成的数。设\(SA_i\)......
  • MyBatis 在大数据量下使用流式查询进行数据同步
    通常的数据同步中,如果数据量比较少的话可以直接全量同步,默认情况下,完整的检索结果集会将其存储在内存中。在大多数情况下,这是最有效的操作方式,并且由于MySQL网络协议的设计,因此更易于实现。但是如果数据量很大的话,全量同步需要大量的内存,如果内存不足的话则可能会导致内存溢出。......
  • 数据结构基础一
    数据结构基础一1.单链表(数组模拟)常用的是邻接表(其实就是单链表,邻接表就是用多个单链表存储了多条线?!),一般用来存储图和树,使用结构体和指针来表示数组的时候,是使用的动态开辟空间,速度太慢,所以一般使用数组来静态模拟单链表。数组模拟单链表的思路:首先开辟两个足够大的数组,一个是存......
  • boot-admin 项目数据库缺省字段设计之最佳实践
    数据库(Database)中的缺省字段(也称为默认字段),就是在一般情况下,每个数据表(Table)必须包含的字段(Field),这类字段用于满足特定的数据需求,字段值的填充或更改一般遵照一定的逻辑要求。缺省字段的设计应该考虑到数据的完整性和一致性,以确保数据的正确与可靠,设计合理的表字段对于数据的有效......
  • 【大数据】Presto(Trino)REST API 与执行计划介绍
    目录一、概述二、环境准备三、常用RESTAPI1)worker节点优雅退出2)提交SQL查询请求3)获取查询状态4)获取查询结果5)取消查询请求6)获取Presto节点信息7)获取Presto服务器使用统计信息8)获取查询计划四、Presto(Trino)执行计划一、概述Presto(现在叫Trino)是一个分布式SQL查询引擎,它允许......
  • 用于 LLM 的公开的数值数据
    用于LLM的公开的数值数据这个存储库包含了用于训练OpenAI的大型语言模型的一部分公开的数值数据。这些数据已经被处理成符合OpenAI的数据管道格式。此外,我们还提供了一个 Python脚本,用于将原始的表格数据转换成适合训练的格式。数据来源这些数据来自于以下公开的来源:......