转载

数据分析实战之【小提琴图】

先看一个【小提琴图】的示例:

数据分析实战之【小提琴图】

如何解读分析【小提琴图】?

【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。 在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。

数据化分析解读:

1.通常汽缸数量少的汽车每加仑汽油可以行驶更多里程数;

2.4缸汽车的油耗分布比较分散,6缸汽车的油耗分布相对集中,8缸汽车的油耗分布很不均匀(中间大两头小);

3.4缸和8缸汽车的油耗都存在比较明显的离散值(上侧的须或下侧的须较长)。

如何绘制【小提琴图】?

#在R软件中安装vioplot包

install.packages("vioplot")

#载入vioplot包

library("vioplot")

#定义需要绘制的变量数据

x1 <- mtcars$mpg[mtcars$cyl==4]

x2 <- mtcars$mpg[mtcars$cyl==6]

x3 <- mtcars$mpg[mtcars$cyl==8]

#绘制小提琴图

vioplot(x1,x2,x3,names=c("4缸", "6缸", "8缸"), col="gold")

title("小提琴图:不同缸数对应每加仑汽油行驶里程数分布")

参考书目:《R语言实战》

为方便沟通互动,第一时间看到我的最新原创文章,请加我微信,在微信里面我有问必答,搜索 isjhfx 或 扫描下面的二维码,如果你觉得不错,请推荐给自己的好朋友。

数据分析实战之【小提琴图】

原文  http://blog.sina.com.cn/s/blog_9bed162b0102wn15.html
正文到此结束
Loading...