数据标准是数据治理体系中的核心要素之一。
一方面,统一的数据标准可以在复杂的业务场景下,帮助团队对齐数据口径,提升数据在分析、诊断等场景的质量与效率;另一方面,数仓团队与分析师团队也需要沉淀一套敏捷、可控的数据标准指标管理流程,以便后续在指标口径的增加、修改、下线等方向更标准、高效。
但数据标准建设并不是一个简单的过程。在同一个企业内部,也存在对标准认知不一致的问题。以银行业举例,对于“客户”的定义,客户部认为“办了银行的卡的人即为客户”,而网银部则认为“银行网站注册过、或者通过银行转账的人都属于客户”,这即是对同一个概念存在认知偏差。
另外,在实际数据开发过程中,也存在开发人员对同一个字段采用不同的命名,或者存在同义不同名的元数据字段,导致沟通成本增加,甚至最终影响数据质量。
近期,火山引擎大数据治理研发套件DataLeap上线的「数据标准」模块瞄准这一问题,希望为数据从业提供一套数据标准的管理能力。
据介绍,该模块已提供数据标准、标准代码、命名词典管理的功能,还支持对各类数据源的库表进行扫描,并进行智能推荐对标。对于企业整体的数据标准情况,DataLeap则提供可视化的统计大盘,帮助数据团队快速了解标准的新建情况和使用情况。
火山引擎DataLeap数据标准产品页面
用户仅仅只需要操作3个关键步骤,即可完成数据标准统一:
- 标准建立:通过在标准域管理预先定义好字段类型配置,实现版本资产映射管理,支持批量导入,实现数据标准代码统一、命名词典批量导出。
- 标准管理: 查看版本历史,帮助用户订阅标准并查看变更日志记录。
- 标准映射:可将数据标准与多种数据源字段建议映射,可查看数据标准评估结果,或根据映射通过情况纠正。
在使用场景上,用户基于DataLeap完成统一数据标准建设,消除数据不一致性,推动数仓规范数据建设,还可以与指标服务打通,对接数据地图资产,进一步达到数据治理的目的。
除了数据标准管理之外,火山引擎DataLeap还提供数据集成、开发、运维、治理、资产、安全等能力,帮助用户提升数据研发效率、降低管理成本,加速推动企业的数字化转型,目前已经应用于泛互联网、制造、新零售、汽车等领域。
立即跳转火山引擎 DataLeap 官网了解更多
标签:映射,管理,标准,引擎,DataLeap,易用,数据 From: https://blog.51cto.com/bytedata/6386007