首页 > 其他分享 >MDM主数据平台如何实现质量管控

MDM主数据平台如何实现质量管控

时间:2023-12-21 14:06:02浏览次数:33  
标签:巡检 管控 MDM 平台 校验 数据管理 清洗 数据


当企业业务以及信息化建设发展到一定阶段后,都不可避免地要进行信息化和数据的治理工作,而主数据治理则是数据治理的基础。随着信息系统和业务的增加,系统打通与数据集成共享必然会成为企业信息化建设的瓶颈,而要实现系统集成,就要保证系统中共享数据的准确性,而主数据就是最重要的共享数据,只有保证主数据的准确、一致,才能保证系统数据集成时业务和数据的准确性。

主数据治理由于要贯穿企业内部大量系统和业务流程,所以保证主数据全面性、准确性、一致性至关重要,主数据的质量直接影响业务质量以及系统集成的质量,所以在进行主数据治理时,治理后的主数据质量是考核主数据治理成果的有效方式。

1总体说明

MDM主数据管理平台主要满足企业内部主数据的全生命周期管理,通过平台实现主数据治理,从而提升主数据质量,满足主数据集成、应用、管控的需求。由于主数据是企业内容最核心的数据之一,保证主数据质量是保证业务数据质量的基础,所以对主数据质量的管控是主数据平台非常重要的一项功能

1.1功能架构

从功能而言,MDM主数据平台包括MDM主数据管理平台和MDC主数据控制台两部分,功能架构图如下:

MDM主数据平台如何实现质量管控_数据清洗

在整个主数据功能体系中,主要强调主数据的全生命周期管理以及主数据质量管理,通过主数据管理平台实现主数据管理,并从数据清洗、校验、巡检等功能保证主数据质量,而主数据控制台服务于主数据管理,为主数据管理提供动态配置能力,包括基于元数据的模型配置、流程配置、接口配置等,从而保障主数据平台可以有效应用于各种不同的业务场景中。

1.2管理流程

MDM主数据平台强调主数据的全生命周期管理,包括数据清洗、申请/采集、维护、校验、审核、发布、归档等,通过管理保证主数据的唯一性、准确性和完整性,支撑业务的使用以及集成需求。

MDM主数据平台如何实现质量管控_主数据治理_02

在主数据的全生命周期管理中,数据清洗、申请/采集、维护、校验、审核是保证主数据质量的关键环节,其中清洗是前置管理,保证初始化数据的质量;申请/采集、维护是过程管理,在数据维护过程中控制;校验、审核时后置管理,是对已有或已到达的数据的控制。

1.3数据质量

MDM主数据平台对主数据的质量控制主要在三个层面:数据清洗、数据校验和数据巡检。

1.数据清洗:针对历史数据的清洗,主要清洗历史的重复数据、不规则数据,保证历史数据的唯一、准确,从而为主数据管理提供初始化数据;

2.数据校验:主要针对主数据申请、维护的过程,通过校验规则对主数据变更过程中的数据进行校验,从而保证录入信息的准确性;

3.数据巡检:针对主数据平台内部已存在的数据,通过巡检规则检查相似数据,从而减少人工维护数据的异常率。

2数据清洗

数据清洗是主数据治理过程中第一个质量控制环节,主要是针对企业内部已经存在的供应商,通过清洗将存量数据标准化、统一化,从而支撑后续的主数据治理工作。

2.1清洗原则

1.数据唯一性:保证主数据的唯一性、完整性、一致性和合理性。对于主数据编码,如果现有编码满足主数据管理要求,可以直接使用原编码,但要保证编码一致性。

2.数据全面性:主数据清洗需要覆盖全部的主数据,保证数据清理的全面性和完整性。

3.数据一致性:确保主数据的一致性,即相同数据在不同系统、不同功能或不同时间点上的表达方式一致,制定统一的数据规则,不同格式的数据需要进行转换,如:日期数据统一格式为YYYY-MM-DD,时间数据统一为YYYY-MM-DD,浮点型数据统一为2位小数。

4.数据完整性:确保数据信息的完整性,根据主数据标准规范,数据中必填项信息要完整,缺失的信息需要进行补录。

5.数据准确性:确保数据真实可信,在数据清洗过程中,需要对数据进行校验和核实,发现异常数据及时修正。

2.2清洗功能

MDM平台的数据清洗通过清洗功能实现,在清洗功能中,可以根据主数据模型配置导出对应的主数据模板,然后按照模板进行数据导入,MDM平台会根据主数据的元数据配置自动进行清洗检验工作

1.下载模板:

MDM主数据平台如何实现质量管控_主数据_03

2.补充数据:

MDM主数据平台如何实现质量管控_主数据治理_04

3.导入清洗:

MDM主数据平台如何实现质量管控_主数据治理_05

4.导出错误数据:

MDM主数据平台如何实现质量管控_数据质量管理_06

5.修改重新导入:

MDM主数据平台如何实现质量管控_数据质量管理_07

6.导出清洗结果:

MDM主数据平台如何实现质量管控_数据质量管理_08

7.将导出成功的数据导入主数据管理中:

MDM主数据平台如何实现质量管控_数据_09

2.3注意事项

1.MDM主数据平台的清洗是基于元数据的配置来进行,所以如果需要进行数据清洗,就需要保证元数据相关配置的准确性;

2.通过MDM平台清洗时需要先下载Excel模板,按照模板进行数据录入,但注意不要修改模板的表头和元数据定义信息

3.数据清洗完成后需要通过“导出清洗结果”导出全部成功数据,再通过主数据管理的“数据导入”导入对应的数据。

3校验规则

校验规则主要针对数据管理维护过程中的数据质量控制,主要是通过对主数据模型的元数据配置校验规则,在进行数据清洗、新增、变更时,MDM平台会自动校验录入数据的准确性。

3.1应用场景

在主数据平台中,校验规则主要有以下应用:

1.手动录入校验:MDM平台最基础的校验策略,根据元数据配置的规则,在进行人工维护数据时校验数据准确性;

2.接口同步校验:一般MDM平台的主数据大多数来源于各个业务系统,为了保证业务系统主数据进行MDM平台的准确性,通过接口将主数据同步至MDM时,也会触发校验规则对入参数据进行校验;

3.数据清洗校验:主数据清洗功能对历史数据进行清洗时,也是依赖校验规则对数据的信息进行校验,包括数据必填、格式等,如图就是必填字段没有数据,从而清洗出的异常结果。

MDM主数据平台如何实现质量管控_主数据治理_10

3.2应用说明

校验规则的应用首先需要在元数据中配置校验规则,之后才能在数据维护时生效。

1.为元数据配置校验规则:

(1)必填校验:

MDM主数据平台如何实现质量管控_数据清洗_11

(2)格式校验:

MDM主数据平台如何实现质量管控_主数据_12

2.在数据管理中录入数据:

MDM主数据平台如何实现质量管控_数据质量管理_13

数据维护页面会有必填提示,空数据保存时会有非空提示。

3.3注意事项

1.除必填校验、唯一校验外,其他的校验规则都是元数据校验规则中选择;

MDM主数据平台如何实现质量管控_主数据治理_14

2.校验规则可以通过“正则表达式扩展”;

MDM主数据平台如何实现质量管控_主数据_15

3.对于录入时自动生成的只读属性,如配置编码规则后的“编码”属性,需要关闭编码的非空校验,否则会导致保存时非空校验无法通过而录入失败;

4.校验规则支持多选,根据属性需要同一个元数据可以同时配置多个校验规则。

4数据巡检

数据巡检主要是针对MDM平台已经存在的数据进行巡检,根据配置的巡检规则对存量数据进行检查,检查相似数据并进行结果统计,根据结果可对数据进行确认以及修改。

4.1应用场景

数据巡检的场景主要有两个,一是部分巡检,二是全量巡检。

1.部分巡检:手动选择数据进行巡检,需要在数据管理中进行操作,如图:

MDM主数据平台如何实现质量管控_数据质量管理_16

2.全量巡检:通过MDM平台的“数据巡检”功能对单一类别主数据的全部数据进行巡检,如图:

MDM主数据平台如何实现质量管控_数据_17

4.2应用说明

1.配置巡检规则:在功能模型中定义巡检的相似度和巡检字段;

MDM主数据平台如何实现质量管控_主数据治理_18

2.部分巡检:选择数据,手动点击“重复检查”;

MDM主数据平台如何实现质量管控_数据清洗_19

3.全量巡检:“数据”巡检功能,选择主数据,点击“执行”;

MDM主数据平台如何实现质量管控_主数据治理_20

4.结果查看:

MDM主数据平台如何实现质量管控_主数据_21

5.查看相似信息:高亮显示重复信息,如果不是重复信息,可以进行排除。

MDM主数据平台如何实现质量管控_数据_22

4.3注意事项

1.数据巡检功能需要先在功能模型中配置巡检相似度和巡检字段

2.巡检相似度:范围为0~1,0是完全不同,1代表完全相同;

3.巡检字段:表示需要进行重复判断的字段,支持多选,多选时代表多个字段同时生效,注意多个字段是“且”不是“或”;

4.注意巡检时选择的属性越多,巡检速度越慢,是呈指数级增长的。

5分析总结

主数据治理是大多数企业在信息化发展过程中的必经阶段,随着信息系统和数据量增大,进行主数据治理,保证主数据标准、统一、一致是保证业务数据准确,建立数据资产体系的必要手段。

5.1功能总结

MDM主数据平台主要面向于主数据治理,构建主数据治理和管控体系,通过全生命周期的主数据管理以及主数据集成、安全、质量等方面的能力,保证主数据治理能有效落地,提高主数据质量的同时,也能服务企业内众多的异构系统,从而实现各系统间的主数据统一、标准,为企业数据的标准化、统一化提供基础。

5.2价值分析

主数据质量是主数据治理过程中非常重要的一环,也是体现主数据治理价值的有效方式,主数据是企业管理和运营的基础,如果主数据质量不够,将直接影响企业运营的稳定性和准确性。同时主数据还是数据分析、决策支持的重要支撑,如果主数据质量不够,数据错误或不准确,将会直接影响企业的数据分析结果和领导层的决策制定。

5.3说在最后

一般而言,大多数企业的信息化建设都是从业务开始,在信息化早期都不会太关注主数据建设,但是随着业务的发展、信息化的扩展、数据价值的不断凸显,主数据的准确性就会越来越重要。所以对企业而言,在信息化建设的过程中,重视主数据、关注主数据的质量与价值非常重要,而主数据又是全集团共享的数据,往往涉及众多部门,所以需要企业的领导层去推动主数据治理。

对企业而言,主数据治理是一项长期的工作,需要投入足够的人力、物力去关注、优化和解决主数据管理过程中存在的问题,需要建立一套标准、规范、行之有效、符合企业实际的主数据标准,并且能够保证标准的落地执行,才能真正发挥主数据治理的价值,真正通过主数据治理服务于业务、服务于企业。

标签:巡检,管控,MDM,平台,校验,数据管理,清洗,数据
From: https://blog.51cto.com/u_15710237/8923377

相关文章

  • MDM主数据平台如何管理参考数据
    MDM基础数据管理平台是进行清洗和治理企业的主数据,使企业的主数据具有唯一性、准确性、一致性、及时性,通过主数据数据清洗功能将错误数据和重复数据进行清洗,从而保证企业数据能够做到以上那几点,然后再分发至下游系统,使企业信息化更加完善。MDM主数据管理平台作为数通的一款核心产品......
  • 原生、复杂流程操作、融合专家系统,详解企业级Agent平台澜码AskXBOT
    文/王吉伟就在ChatGPT上线一年后的第一周,谷歌发布了其最强大模型Gemni,一度被称作GPT-4杀手锏,也被视作谷歌挣回面子的“雪耻”之作。然而没过几天,Gemini就被曝夸大营销,所谓的碾压GPT-4仅是嘴上功夫,通过与GPT-4不一致的测试标准混淆跑分,更被嘲讽是在趁OpenAI内部动荡搞事情。紧接着就......
  • 羚通视频智能分析平台 视频监控AI智能算法分析车辆识别 车辆监测预警
    在当今社会,随着科技的飞速发展,视频监控技术已经深入到我们生活的各个角落。而在这其中,车辆识别算法更是成为了一个重要的研究方向。今天,我们就来详细介绍一下羚通视频智能分析平台的车辆识别算法。羚通视频智能分析平台是一款集视频监控和算法检测于一体的智能分析平台。它通过先......
  • 企业数字化转型利器:低代码开发平台
    第一部分:数字化转型的背景与挑战背景:数字时代的企业演变在21世纪的数字浪潮中,企业正在经历一场深刻的变革。从传统的业务模式转向以数据和技术为核心的数字化运营,已成为企业生存和发展的关键。这种转变不仅关乎技术的更新换代,更涉及到企业战略、运营模式、组织结构乃至文化的全面革......
  • vivo 容器平台资源运营实践
    作者:vivo互联网服务器团队-ChenHan容器平台针对业务资源申请值偏大的运营问题,通过静态超卖和动态超卖两种技术方案,使业务资源申请值趋于合理化,提高平台资源装箱率和资源利用率。一、背景在Kubernetes中,容器申请资源有request和limit概念来描述资源请求的最小值和最大值。......
  • 最新Docker搭建DVWA和SQLi-LABS漏洞练习平台
    搭建DVWADVWA是一款开源的渗透测试漏洞练习平台,内含XSS、SQL注入、文件上传、文件包含、CSRF和暴力破解等漏洞的测试环境。可以在Docker Hub上搜索DVWA,有多个用户共享了搭建好的DVWA镜像(注意,有些镜像可能存在后门),此处选择镜像——sagikazarmark/dvwa,安装命令如下:docker pull......
  • 某领先的集成电路研发中心:建立跨网交换平台 杜绝数据泄露风险
    1、客户介绍某技术领先的集成电路研发中心,是产学研合作的国家级集成电路研发中心,致力于解决重大共性技术的研发及服务支撑问题。该中心积极探索国际化道路,不断提升国际影响力,与多家国际著名集成电路企业和研发机构建立技术合作及联合实验室。2、建设背景       ......
  • 平台代收代付数据库表的设计
    平台代收代付数据库表的设计1.费用项目通过cost_code来唯一标识,根据费用编码来锁定费用,不使用在数据表中比如费用表,每增加一个费用而增加一个费用字段的方式,这样会导致不灵活,不容易扩展。通过费用编码的方式,可以将费用表的字段的方式纵向的拉平为多条费用的横向方式,便于扩展,系统......
  • ZFSoft KINGOSOFT SouthSoft 高校智慧校园教学综合服务平台
    KINGOSOFT高校智慧校园教学综合服务平台网址:www.kingosoft.com地址:湖南省长沙市三一大道526号旺德府恺悦国际大厦16层青果软件集团有限公司是一家高新技术企业、中国教育信息化理事会副理事长单位,创建于2000年03月28日,注册资金6000万元,员工300余人,总部设在湖南......
  • EasyCVR平台如何通过api接口设置实时流的sei数据实现画框等操作?
    为了便于用户自由调用、集成与二次开发,EasyCVR平台也提供了丰富的API接口供大家使用。今天我们来分享一下如何通过API接口设置实时流的SEI数据,实现在视频播放器中展示文本内容、画框等操作?1)后端接口调用如下:接口URL:POSThttp://127.0.0.1:18000/api/v1/sei/set2)接口参数如下:3)调用成......