注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据文化

数据分析和可视化探讨

 
 
 

日志

 
 

时间序列数据分析  

2010-05-27 08:34:48|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

时间序列是一个十分常见的数据类型。几乎所有商业上的数据集,都有一个时间的dimension。而很多商业的数据分析,也是集中在数据随着时间的流动的变化规律。我们这里通过对北京的房价数据做一个时间序列分析,从而探讨一下不同可视化方式的有效性。

下面是北京房屋均价在20092010的数据集(部分显示)。

时间序列数据分析 - datavis - 数据文化
 

对时间序列最简单的显示,是把时间放在X轴,把数据通过折线画在Y轴。因为折线很自然地表示了一种趋势,我们可以很容易地把数据根据时间的变化很清晰的表现出来

时间序列数据分析 - datavis - 数据文化
 

通过图表,我们可以很快地观察到各个区域房价变化的趋势和幅度。房价在2009年底前,基本保持了一个平稳增长的趋势。2009年底到2010年初,房价有一个比较大的跳跃。尤其是四环内的房价。在短时间内增长了超过百分之三十。

但由于四个地区房价绝对值差别很大,如果我们想比较房价增长值的百分比就不是很容易。最直观的办法是把百分比变化直接画在图上。

时间序列数据分析 - datavis - 数据文化

我们看到房价的变化基本保持了同样的趋势,但到了后期有了一些不同的分岔。

在我们观察这个图表时,因为折线图的特点,我们会下意识地注意到数据的变化,而不是互相间的比较。如果我们想表达不同地区的同一时间的价格的比较,我们可以把图形改为条形图。

大部分软件会生成一个类似下图的图表。

时间序列数据分析 - datavis - 数据文化
 

因为所有的数据都混杂在一起,我们想要达到的易于比较的目的并没有达到。为了解决这个问题,我们可以把四组数据分别在四个排列在一起的小图表里显示。

时间序列数据分析 - datavis - 数据文化
 

这样数据既易于比较,又没有互相的干扰。

  评论这张
 
阅读(4268)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017