目录
一、小提琴图简介
1.1 小提琴图的概念
小提琴图(Violin Plot
)通常用于显示数据的分布及其概率密度,其结合了箱形图和密度函数的特征,可以很好的显示数据的分布形状。如下图所示,中间的黑色粗线条表示四分位数的范围,从其上延伸出来的细黑线表示95%
置信区间,而白色点则为中位数。
下面内容待定:
箱形图在数据显示方面受到限制,简单的设计往往隐藏了有关数据分布的重要细节。例如使用箱形图时,我们不能了解数据分布是双模还是多模。虽然小提琴图可以显示更多详情,但它们也可能包含较多干扰信息。
小提琴图的内部是箱线图(有的图中位数会用白点表示,但归根结底都是箱线图的变化);外部包裹的就是核密度图,某区域图形面积越大,某个值附近分布的概率越大。
通过箱线图,可以查看有关数据的基本分布信息,例如中位数,平均值,四分位数,以及最大值和最小值,但不会显示数据在整个范围内的分布。如果数据的分布有多个峰值(也就是数据分布极其不均匀),那么箱线图就无法展现这一信息,这时候小提琴图的优势就展现出来了!
1.2 小提琴图与箱线图、核密度函数以及高斯混合体之间的关系与区别
核密度函数图:本质上是直方图的拟合曲线,其可以看作概率密度曲线。以正态分布的核密度函数为例,可结合博文
标签:小提琴,线图,None,axs,Python,matplotlib,绘图,True,boxplot From: https://www.cnblogs.com/metafullstack/p/17658735.html