箱线图
定义:样本分布的图形化汇总,显示其形状、中心趋势和变异性
- 异常值:超过上限或下限的观测值
- 上限:延伸至距框顶部1.5倍框高范围内的最大数据点
- 四分位间距框:中间50%的数据
- 顶部线条:Q3 (上四分位数)。75%的数据小于等于此值
- 中间直线:Q2(中位数)。50%的数据小于或等于此值
- 下部直线:Q1(下四分位数)。25%的数据小于等于此值
- 下限:延伸至距框底部1.5倍框高范围内的最小数据点。
四分位:
- Q1:1/4
- Q2:2/4
- Q3:3/4
举例
数据:3、7、11、11、14、15、17、18、20、25、35
总个数:11+1 = 12
中位数:12*2/4 = 6 第6位 15
Q1:12*1/4 = 3 第3位11
Q3:12*3/4 = 9 第9位 20
四分位距IQR:Q3-Q1=9
上限:Q3+1.5IQR = 20+1.5*9=33.5 最大值就是25
下限:Q1-1.5IQR = 11-1.5*9 = -2.5 最小值就是2
异常点:35
标签:Q1,线图,Q3,12,1.5,四分,11 From: https://www.cnblogs.com/wuzimeimei/p/17918861.html