当前位置:首页 > 报告详情

vivo湖仓一体-徐昱-datafun.pdf

上传人: s**** 编号:157179 2024-03-16 32页 2.48MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
vivo大数据基础团队为应对传统数仓的痛点,如冗余计算、存储、不支持流批同源、更新成本高、实时写入数据无法批量查询等,引入数据湖技术,主要应用于流批同源、实时链路优化及宽表拼接等业务场景。选型Hudi 0.14.0、Flink 1.13.2、Spark 3.2.0等组件,并通过增强Hudi组件能力、优化组件性能(如commits限流、clean算子优化、BulkInsert性能优化、查询优化等)有效降低了计算成本、提高了任务稳定性和数据写入性能。未来展望包括构建时延更低的湖仓架构体系、切换更高效的压缩算法、支持一致性Hash、挖掘更多业务场景等。
"vivo如何通过湖仓一体降低数据存储成本?" "湖仓一体架构下,vivo如何优化实时数据处理性能?" "vivo在湖仓一体架构中还有哪些未来优化计划?"
客服
商务合作
小程序
服务号
折叠