注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据文化

数据分析和可视化探讨

 
 
 

日志

 
 

OLAP与数据分析  

2010-07-31 06:53:17|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

说到数据分析,OLAP大概是BI厂家最常见的选择。如果你看看国内BI厂家的宣传资料,如果提及数据统计,OLAP应该是必谈的话题。为什么OLAP会变成和数据分析几乎同意的词?二者是否真正的是几乎等同?我们在这里来做一个了解。

OLAP从字面上是指及时的数据分析。但实用中,OLAP更多的是指针对数据分析的一种解决方案。OLAP的软件把数据预处理成数据立方。基本是把有可能的汇总都预先算出来。在用户选择显示某种汇总时,OLAP可以在预先的计算出来的结果基础上很快地计算出结果。从而可以很好地支持极大量数据的及时分析。

也就是说OLAP实际上包括了两个方面。第一,OLAP提供了一个互动的数据分析的模式。OLAP把数据分成维(dimension)和度量(measure)。用户通过选择dimensionmeasure,可以及时地计算数据在不同dimension的组合下的汇总。在这里可能有一个误区。其实OLAP本身并没有定义一个用户端的互动模式。比如大部分传统的OLAP是通过一个交叉表的界面,但是新的界面更多的采取可视化的图表形式。

第二点,可能是更本质的,是OLAP定义的一种对数据的处理方式。这包括了对数据预计算的思路和方式。在国内厂家里,很少有自己开发OLAP后端数据处理的。在国外厂家中,有自己OLAP后端的有IBMMicrosoftOracle等。

作为一个有着十几年实际应用历史的技术,OLAP是当之无愧的数据分析的元老。但在OLAP的应用中,用户也遇到了很多问题。其中最为关键的就是OLAP在灵活性上的缺陷。OLAP的使用要求用户事先对数据有一个分析,把所有的dimensionmeasure都罗列出来。这样OLAP处理器就可以把相关的值预先计算出来。

而由于数据立方需要很大的空间。它的大小是以指数增长的。所以在设计OLAP的时候,用户又必须把dimension的数量限制在一个相对比较小的范围。在实际应用时,用户只能在这个预先选择好的dimension之内来进行分析。如果用户需要从不同的角度来看这些数据,这个OLAP就必须重新设计和生成。

近年来,BI领域出现了几项大的技术革新,在很大程度上弥补了OLAP的不足。在前端的显示上,数据分析更多地采用了可视化的模式。这里并不是简单地指通过图表来显示OLAP的结果。新的可视化数据分析工具在通过图表对数据进行显示的基础上,实现了一个完整的互动模式,让用户可以任意的通过不同的角度和方法对数据进行检验。

在后端的处理上,以列为主导的数据库结构,及云计算的概念,使及时分析可以不再依靠预计算就可以处理极大的数据量。这样既解决了大数据的运算,也避免了OLAP所带来的不灵活的问题。

StyleScope是一个综合了可视化理论,和以列为主的云计算的数据处理结构,达到了一个完美的结合。用户不再需要面对复杂的OLAP系统,可以十分快捷地创建起一个强大的数据分析系统。

  评论这张
 
阅读(500)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017