mdrill

基于mdrill的大数据分析 2015-11-03

数据越来越多,传统的关系型数据库支撑不了,分布式数据仓库又非常贵.几十亿.几百亿.甚至几千亿的数据量,如何才能高效的分析? mdrill是由阿里妈妈开源的一套数据的软件,针对TB级数据量,能够仅用10台机器,达到秒级响应,数据能实时导入,可以对任意的维度进行组合与过滤. mdrill作为数据在线分析处理软件,可以在几秒到几十秒的时间,分析百亿级别的任意组合维度的数据. 在阿里10台机器完成每日30亿的数据存储,其中10亿为实时的数据导入,20亿为离线导入.目前集群的总存储3200多亿80~400
一周排行