想象一个房间里充满了彩色气球,每个气球都象征着数据集中的一个数据点。由于其不同的特征,气球漂浮在不同的高度。现在,想象一些充满氦气的气球出乎意料地飞得远远高于其他气球。正如这些特殊的气球会破坏房间的均匀性一样,异常值也会破坏数据集中的模式。
从这个丰富多彩的类比回到纯粹的统计数据,异常值被定义为异常,或者更好的是,与数据集其余部分显着偏离的数据点。
想象一个房间里充满了彩色气球,每个气球都象征着数据集中的一个数据点。由于其不同的特征,气球漂浮在不同的高度。现在,想象一些充满氦气的气球出乎意料地飞得远远高于其他气球。正如这些特殊的气球会破坏房间的均匀性一样,异常值也会破坏数据集中的模式。
从这个丰富多彩的类比回到纯粹的统计数据,异常值被定义为异常,或者更好的是,与数据集其余部分显着偏离的数据点。