使用语言自带数据集mpg,不明白字段含义的可以执行?mpg查询
1 并列箱线图(跨组比较)
比较四缸、六缸和八缸汽车每加仑汽油行驶英里数(因为五缸车很少,所以删除五缸车的数据)。
还要将year和cyl从连续性数值变量转化为分类(分组)因子。
cars<-mpg[mpg$cyl!=5,]
cars$Cylinders<-factor(cars$cyl)
cars$Year<-factor(cars$year)
ggplot(cars,aes(x=Cylinders,y=cty))+
geom_boxplot()+
labs(x="Number of Cylinders",y="Miles Per Gallon",title="Car Mileage Data")
#随着气缸数的增加,燃油效率在降低,在四缸车车组中还有4个离群点(英里数异常高的汽车)
2 含凹槽的箱线图(比较各组的中位数)
通过添加notch=TRUE得到含凹槽的箱线图。
ggplot(cars,aes(x=Cylinders,y=cty))+
geom_boxplot(notch=TRUE,fill="steelblue",varwidth=TRUE)+
labs(x="Number of Cylinders",y="Miles Per Gallon",title="Car Mileage Data")
#在标准箱线图中,箱子宽度没有任何意义。添加varwidth=TRUE后,箱线图宽度与每个组的观测值数量的平方根成比例。
3 多个分组因子的箱线图
绘制不同年份不同气缸数量车型每加仑汽油行驶英里数的箱线图:
ggplot(cars,aes(x=Cylinders,y=cty,fill=Year))+
geom_boxplot()+
labs(x="Number of Cylinders",y="Miles Per Gallon",title="City Mileage by # Cylinders and Year")+
scale_fill_manual(values=c("gold","green"))
#添加函数scale_fill_manual()用于自定义填充颜色。每加仑汽油行驶英里数的中位数随着气缸数量的增加而减少。对于每个组,2008年较1999年的每加仑汽油行驶英里数有所增加。
标签:线图,Cylinders,之箱,ggplot2,每加仑,TRUE,英里,fill From: https://blog.csdn.net/2302_80828325/article/details/143997880