注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据文化

数据分析和可视化探讨

 
 
 

日志

 
 

数据墨水与图表设计  

2010-05-28 12:12:42|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

图表的应用已经有上千年的历史。在近几十年,也有很多深入的研究。比如贝尔实验室的Cleveland在七十年代开始的一系列著作,对图表及其所涉及到的不同方面做了很详尽的分析。

但作为实际操作中可以很快应用的,还要算Tufte教授提出的数据墨水的概念。数据墨水,是指把所有显示的点分为数据和非数据的显示。图表设计的目标,是在不影响数据的表达的前提下,尽量提高数据墨水对非数据墨水的比例。

这个概念理解起来是很容易的。但实际操作中,往往会遇到很多模糊的时候。Tufte的建议是想象你有一个橡皮擦,然后分析每一种显示的点,看看擦掉它会不会影响数据的显示。在没有点开擦的时候,这个图表就达到了最优的状态。

但对那些是可擦,那些不可擦,是一个很主观的判断。需要很多练习和对人的视觉的理解。我们在此应用一个例子,通过对数据墨水的概念做一个实际的应用,来探讨一下这过程中平衡的掌握。

下面是在北京统计局网站找到的一个统计图。我们来通过数据墨水来分析一下这个图表的可改进点。

数据墨水与图表设计 - datavis - 数据文化
 

我想每个人第一次看到这个图表,注意力都会很自然地被吸引到很浓重的背景色去。从数据墨水的角度分析,背景色是完全的非数据墨水。它没有显示任何有用的信息,反而占用了读者宝贵的注意力。首先是应该去掉的。

其它还有以下的非数据墨水问题:

1.        图中的Legend完全没有必要。因为图表只显示了一组数据,同时已经在标题上显示了。如果我们把它擦掉,不会损失如何信息。

2.        折线下面有一点阴影。也是非数据墨水性质的。

3.        图里的格线也有一些过多,可以适当减弱。

因为不知道这个图所用的工具,我们不能一步一步的显示每一种改变的效果。下图是一个用StyleScope重新实现的图表。

数据墨水与图表设计 - datavis - 数据文化
 

在这个图里,还做了一个小的改动。零的格线做了一点小的加深。这样可以比较容易的判断数据是正还是负。总体来讲,数据所占的比重比原来大了很多。第一眼不会再把读者吸引到和数据无关的部分去。

其实对减低非数据墨水的概念,并不是没有争议的。很多BI厂家以做出绚丽的图形为荣,而不太多的考虑图表的有效性。我们建议在实际操作中最好能达到一个平衡。在不影响数据的显示的情况下,图表的美观确是需要做的尽量好。但前提是美观的外表不影响的数据的最好的表达。

  评论这张
 
阅读(330)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017