前情提要:数据价值管理是指通过一系列管理策略和技术手段,帮助企业把庞大的、无序的、低价值的数据资源转变为高价值密度的数据资产的过程,即数据治理和价值变现。第一讲介绍了业务架构设计的基本逻辑和思路。前面我们讲完了数据资产建设标准、数据归集标准、数据处理标准三大标准类型。
本章我们讲解数据验收标准
数据验收是对数据治理结果的确认动作,是对开放共享的数据集在使用前的最后一道质检动作。
数据验收标准的制定来源于两个方向:
1.数据分级分类标准+质量目标值;
2.数据资产建设标准+数据归集标准+数据处理标准制定的数据规则;
1.数据分级分类标准+质量目标值
A.数据分级分类:这里特指根据数据对组织运营、决策、服务等的影响程度,将数据分为重要数据和一般数据。通过数据分级分类,识别出组织内部的重要数据;
重要数据的判定标准可以参考数据使用频率、数据价值(获取难易程度、获取成本、数据的稀缺性)2个大维度来衡量;
B.基于识别出来的重要数据和一般数据,制定不同的数据质量管理策略,例如重要数据的准确性、完整性、一致性等维度的质量目标需要达到99.8%。一般数据的准确性、完整性、一致性等维度的质量目标需要达到95%;
2.提取数据资产建设标准+数据归集标准+数据处理标准制定的相关数据规则
数据资产建设标准提取的信息包含:
在数据资产建设中提取参考标准
数据归集标准提取的信息包含:
数据归集范围标准
数据归集范围标准是描述数据归集数据集的范围,数据集范围(例如数据库、表单、文件范围)、字段范围、时间范围、地域范围、业务范围;
模型设计和接入血缘标准
模型设计和接入血缘标准是定义数据从数据源到数据入到组织内部的转换过程中的标准,需要描述来源数据集、来源字段、来源数据存储颗粒度、写入数据库、写入表、写入字段;
数据入库/湖的处理规则
数据入库/湖的处理规则是在模型设计和接入血缘标准的基础上对于某些特殊字段的简单处理规则,例如时间格式转换,全角半角符号转换等;
数据处理标准提取的信息包含:
数据处理规则的需求描述;
结合上述标准和规范,制定数据验收标准,模板如下所示: