当前位置:首页 > 报告详情

Doris Bitmap 精确去重优化实践.pdf

上传人: 2*** 编号:135179 2023-07-09 35页 5.67MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了美团OLAP引擎开发工程师魏翔在DataFunSummit 2023上的演讲内容,主要围绕Doris Bitmap的精确去重优化实践展开。 关键点如下: 1. 精确去重简介:去重计算在指标计算中复杂度较高,业界解决方案有数仓生产、模糊去重和精确去重。数仓生产依赖数仓生产指标,查询时延低但灵活性差;模糊去重使用HyperLogLog,查询时延适中但存在误差;精确去重采用预聚合和Bitmap,支持灵活维度分析且查询时延较高。 2. Bitmap聚合性能优化:Bitmap聚合在处理高基数场景时存在性能瓶颈,如多次container union操作和元素上涨导致的额外内存分配。优化方法包括基于输入数据布局的优化(如字典编码、正交编码)和基于计算流程的优化(如直接使用bitset、bitmap序列化shuffle时检查是否需要降级array)。 3. 结合Doris向量化引擎:Doris向量化引擎可以优化Bitmap内存使用、Fast Union和聚合下推。如使用Jemalloc替换Tcmalloc降低Bitmap列拷贝开销,Fast Union减少数据移动,聚合下推充分利用scanner线程并发。 4. 优化效果与总结:基于输入数据分布的优化和计算流程的优化在不同基数场景下有显著提升,如十亿级基数提升5倍、亿级基数提升10倍;结合Doris引擎相关优化如Bitmap COW、Fast Union和聚合下推,可减少端到端时延20%~50%。 综上,魏翔介绍了Doris Bitmap精确去重优化的实践方法和技术细节,并通过数据展示了优化效果。
"Doris如何实现Bitmap精确去重?" "如何通过Roaring Bitmap优化数据聚合性能?" "Doris向量化引擎如何提升Bitmap内存使用效率?"
客服
商务合作
小程序
服务号
折叠