数据分析实战之【小提琴图】

先看一个【小提琴图】的示例:

数据分析实战之【小提琴图】

如何解读分析【小提琴图】?

【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。 在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。

数据化分析解读:

1.通常汽缸数量少的汽车每加仑汽油可以行驶更多里程数;

2.4缸汽车的油耗分布比较分散,6缸汽车的油耗分布相对集中,8缸汽车的油耗分布很不均匀(中间大两头小);

3.4缸和8缸汽车的油耗都存在比较明显的离散值(上侧的须或下侧的须较长)。

如何绘制【小提琴图】?

#在R软件安装vioplot包

install.packages("vioplot")

#载入vioplot包

library("vioplot")

#定义需要绘制的变量数据

x1 <- mtcars$mpg[mtcars$cyl==4]

x2 <- mtcars$mpg[mtcars$cyl==6]

x3 <- mtcars$mpg[mtcars$cyl==8]

#绘制小提琴图

vioplot(x1,x2,x3,names=c("4缸", "6缸", "8缸"), col="gold")

title("小提琴图:不同缸数对应每加仑汽油行驶里程数分布")

参考书目:《R语言实战》

为方便沟通互动,第一时间看到我的最新原创文章,请加我微信,在微信里面我有问必答,搜索 isjhfx 或 扫描下面的二维码,如果你觉得不错,请推荐给自己的好朋友。

数据分析实战之【小提琴图】

原文  http://blog.sina.com.cn/s/blog_9bed162b0102wn15.html

本站部分文章源于互联网,本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供。如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。

PS:推荐一个微信公众号: askHarries 或者qq群:474807195,里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多

转载请注明原文出处:Harries Blog™ » 数据分析实战之【小提琴图】

赞 (0)
分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址