数据测试设计
正常数据测试应包括数据完整性、数据一致性、数据准确性、数据多样性测试
1数据的完整性
数据完整性是指数据记录和信息完整,不存在缺失情况。数据缺失主要包括记录缺失和记录中某个字段
信息缺失,两者都会导致统计结果不准确。需要关注两点:数据不多和 数据不少。
数据不多:一般检查全表数据,重要枚举值数据是否重复,以及主键是否唯一
数据不少:一般检查全表数据或业务相关的重要字段(如日期、品牌、类目和枚举值等)是否缺失。
如果我们知悉数据量,如表中的品牌字段有X条数据,则检查品牌字段的是否有X条数据即可。如果数据规
模本身变动很大,可以通过对比历史数据条数来评估数据波动是否正常。
2数据的一致性
数据记录规范一致:数据编码和数据格式,如订单ID,从业务来源表到数据仓库每一层中的表都应该是
同一种数据类型,且长度需要保持一致。
数据逻辑一致:多数据间的逻辑处理一致,可以通过数据的diff测试来验证数据的一致性。
3数据的准确性
数值检查:通常需要验证数据值是否在常规范围内,比如人数比例,理论上位于[0,1],是否在业务范围
内,这依赖于对数据业务规则的理解。
时间维度对比:即对比同一组数据在不同时间的波动情况。
空间维度对比:即固定时间维度,将当前数据与其他数据进行对比,进一步保证准确性。
上下游数据对比:检查重要字段数据在上下游的加工过程中是否丢失,与系统内的其他数据对比,与系
统外的其他数据对比。
4数据多样性
如检查集团各类员工能力数据
应分别测试O类、A类、其它类型员工正常数据、较少类数据(如应届生员工)、较多类数据(如集团总裁)
标签:数据测试,检查,是否,缺失,数据,对比 From: https://www.cnblogs.com/markh/p/17373779.html