作者:Steven Yang([email protected])
数据标准化是为了消除数据量纲的差异,把原数据转为无量纲化的表达方式。
公式是原数据减去均值后,除以标准差。
量纲的意思是,同一组数据里,比如1元和1000公里,看起来差别很大。因此,数据也不容易处理。
所以要把数据统统映射要0~1的范围。
注:该方法被广泛使用,但均值和标准差也一样易受离群值影响,因此需要进行修正。比如:可用中位数取代均值进行上述计算。
标签:outlook,原创,均值,标准化,标准差,数据,量纲 From: https://www.cnblogs.com/stevenyang0502/p/16724828.html