编 辑:彭文华
奥运结束了,中国队最终获得了88块奖牌,太牛批了!我谨代表数据人民发来贺信!!!
结果群里有俩彭友在争论,港澳台也是中国的!总共106块奖牌!另一个哥们坚持认为是88块,俩人就这么吵起来了。
也有些彭友荣誉感爆棚,在彭友圈发表意见:
啊这.......
合咱的情,合咱的理,都没毛病。但是,这个还真不合“法”,不符合奥运会的“法”。
奥运会的“法”
有人会着急了,港澳台是中国不可分割的一部分!这是国家主权!我老彭可是坚决维护国家统一的,这观点自然是正确的。
但是奥运会,可不是以“国家”位单位,而是以“组织”为单位的。统计奥运奖牌榜,自然得遵守奥运会的“法”。
那么奥运会的“法”在哪里呢?奥运会的“法”就是业务规则。这得看官方的解释:
奥林匹克大家庭(Olympic Family) 是对所有参与奥林匹克运动的组织和个人的统称,其中国际奥委会、 国家和地区奥委会和国际单项体育联合会等3大组织被称之为"奥林匹克三大支柱" (Olympic Tripartite)。
三大支柱在奥林匹克运动中承担着不同的任务:
国际奥委会负责领导和协调;
国际单项体育联合会负责各种技术性事务,如组织比赛、制定竞赛规则等;
国家和地区奥委会则负责在本地区开展各种活动, 组队参加奥运会等。
组织的概念是大于国家实体的。国家是组织,地区是组织,各地奥组委合适组织。所以奖牌榜的表头都是这样的:国家/地区。
所以,“组织”就是奥运会的“主数据”。这些主数据是必须由国际奥委会审批之后才能获得“合法”身份,参与到比赛的。
香港、澳门虽然都已经回归祖国,但是依然能作为“地区”参与奥运会,并在奖牌榜上单独统计,就是这个原因。
再比如,这次的奥运会,俄罗斯因为被国际体育仲裁法庭(CAS)认定俄罗斯反兴奋剂中心违规,导致不能参加东京奥运会。
所以这次俄罗斯运动员是以俄罗斯奥委会的名义参加的,获奖之后挂的也不是俄罗斯国旗,而是这个:
对,这是俄罗斯奥组委的旗帜。
数据的“法”
奥运会的“法”有了,那数据的“法”也就有了。因为,数据的“法”就是业务规则。
业务上定义清楚了,数据的定义才能清晰,才有“法”可依。而数据的混乱,都是业务上定义不清导致的。
以奥运会为例,奥运会官方统计奖牌榜,是以组织为单位统计的。“组织”就是奥运会体系里的主数据,这是核心数据,必须权威且不可挑战。
但是大家都以“国家”为单位,这就是随意定义口径,挑战数据的“法”,这不就是“口径不一致”,从而导致数据对不上么?
甚至我还看到彭友圈有人贴俄罗斯媒体的统计结果,我也是服了...
一个哥们说中国这次得了88块奖牌,另一个哥们跟他杠上了:明明是106块!
嗯,你俩杠吧,我去歇会儿。因为俩人的“中国”定义都不一样,一个是“中国代表队”,一个是“中国所有代表队”。
我是不会做这个裁判的,因为数据就是数据,每一块奖牌都有据可查,最终的结果,完全取决于业务层面要怎么表达。
比如这个表头,也不太对。中国是国家奥委会,港澳台是地区奥委会。国家奥委会和地区奥委会是平等的,并没有包含关系。对了,第五名的ROC就是俄罗斯奥委会。
所以,你可以说中国的所有代表队获得了106块奖牌,或者说中国队获得了88块奖牌,但不能说中国获得了106块奖牌。
所以,俩哥们在抬杠中国是106块奖牌还是88块奖牌,问题根本不在那个数据是对的,那个数据是错的,而是他们业务定义没有统一。想要让他俩停止争论,其实是要统一他们想要表达的目标,也就是统一核心业务诉求。
数据治理的法
能看到这里的,都是真彭友。因为扯这些,实在是太无聊了!但是数据治理就是这么无聊。
但是不这么细扣,必然会产生各种数据问题。经过奥运会奖牌榜统计的案例,我们就能总结出以下三点:
1、业务规则就是业务的“法”;
2、数据的“法”就是业务规则;3、主数据就是数据的“法”。
因此,我们还能推导出更多的结论:
数据的权威来自于业务的权威。
业务的混乱必然导致数据的混乱。
业务目标的统一,是数据统一的前提。
数据治理,实际上是业务治理。