当前位置:首页 > 报告详情

2017年海量数据在线分析技术剖析.pdf

上传人: 云闲 编号:92561 2021-01-01 10页 2.49MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大数据在线分析技术,比较了HBase系、Dremel系、预聚合系和Lucene系等业内常见的大数据存储和分析方案。指出HBase系和Dremel系在实时性、SQL-like查询和支持超大数据集的在线聚合等方面存在不足。博睿数据科技股份公司采用了基于Impala+Parquet的自研OLAP计算架构,虽然提高了数据实时性和查询性能,但也遇到了数据膨胀、集群I/O资源耗尽等坑。为了避免这些问题,博睿数据进行了集群拆分、查询条件与数据分区的对照索引设计,并优化了大数据技术栈性能监控数据。最终,博睿数据在大数据方向继续探索,推出了大数据开放融合平台Bonree Platform。
如何实现海量数据的秒级在线分析? 大数据存储和分析方案有哪些优缺点? 博睿数据如何优化Impala+Parquet技术方案?
客服
商务合作
小程序
服务号
折叠