mdrill

基于mdrill的大数据分析 2015-11-03

数据越来越多,传统的关系型数据库支撑不了,分布式数据仓库又非常贵.几十亿.几百亿.甚至几千亿的数据量,如何才能高效的分析? mdrill是由阿里妈妈开源的一套数据的软件,针对TB级数据量,能够仅用10台机器,达到秒级响应,数据能实时导入,可以对任意的维度进行组合与过滤. mdrill作为数据在线分析处理软件,可以在几秒到几十秒的时间,分析百亿级别的任意组合维度的数据. 在阿里10台机器完成每日30亿的数据存储,其中10亿为实时的数据导入,20亿为离线导入.目前集群的总存储3200多亿80~400
一周排行
  • HQL原文来自:http://slaytanic.blog.51cto.com/2057708/782175/   Slaytanic老师 关于Hadoop的介绍来自:http://www.cnblogs.com/s ...
  •   同事说查询遇到一个奇怪的事,2个表进行not in 操作没有返回结果,正常情况下应该是有返回的.   一.问题重现 一般来说,问题能重现就是好消息,最怕不能重现.   SQL> connscott/tige ...
  • 课程主页在http://blog.csdn.net/sxhelijian/article/details/39152703,课程资源在云学堂"贺老师课堂"同步展示,使用的帐号请到课程主页中查看.  ...
  • 据theverge的消息,HTC计划于三月发布主打拍照功能的M系列手机作为新的旗舰机型,同时将发布它的第一款智能手表.2011年度,HTC的净利润曾一度达到了20亿美元,而此后,业绩却一再下滑,不过2014年第二财季 ...
  • 协程   协程,即协作式程序,其思想是,一系列互相依赖的协程间依次使用CPU,每次只有一个协程工作,而其他协程处于休眠状态.协程可以在运行期间的某个点上暂停执行,并在恢复运行时从暂停的点上继续执行. 协程已经被证明是 ...
  •   package ivyy.taobao.com.domain.fastjson; import java.util.Iterator; import com.alibaba.fastjson.JSONArray; ...
  • http://zz563143188.iteye.com/blog/1845469
  • 1.不要设计,也不要通过DOM操作去改变你的页面 你用jQuery去设计一个页面,并让它动起来.这是因为jQuery就是让一切简单的事情变复杂的罪魁祸首. 但是用avalon,你必须从零开始去构思你的架构." ...
  • 前几天做的项目中碰到这样一个问题,在 ie6 和 ie7 下,给父元素设置 overflow:hidden 不起作用无法隐藏,后来发现是子元素中有设置 position:relative,如果子元素删除 positi ...
  • Starship Troopers Time Limit: 10/5 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submi ...