当前位置:首页 > 报告详情

天穹OLAP:实时湖仓融合平台架构实践.pdf

上传人: 2*** 编号:135129 2023-07-09 20页 2.55MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了腾讯高级工程师程广旭在DataFunSummit2023上的演讲内容,主要讨论了实时湖仓融合架构的实践和未来展望。 湖仓融合架构的必要性主要体现在:1)数仓加速:数据湖的远程IO成本高,查询性能有待提升;2)实时分析:数据湖的实时性不足,无法满足秒级时效性需求;3)高并发查询:数仓在处理高并发查询方面更有优势。 湖仓融合的意义在于:1)降本增效:简化技术架构,提升易用性,降低运维成本;2)统一数据:保证数据一致性;3)数据治理:统一主数据和元数据,实现上层数据治理。 实时湖仓融合平台具有以下特点:1)接入简单;2)数据实时性更高;3)查询性能更优。但该架构也有不足之处,如支持的湖能力欠缺,数据可能会存储多份导致一定冗余。 湖仓融合总体架构包括:1)数据实时写入到仓,并定时降冷到湖;2)数据实时入湖后,准实时导入到仓。 腾讯内部大量使用Pulsar,但Pulsar的消费性能较差,需要原生支持Pulsar数据以提升性能。 未来展望及规划包括:1)分析型存储冷存储;2)SuperSQL定时调度热查询;3)冷热查询查询类型直接下推;4)数仓以模块化的方式嵌入,实现冷热数据快速查询处理。
"湖仓融合如何提升数据处理效率?" "实时湖仓融合架构的未来发展趋势是什么?" "湖仓融合在腾讯内部的实际应用效果如何?"
客服
商务合作
小程序
服务号
折叠