当前位置:首页 > 报告详情

数据湖在快手的应用实践_034157.pdf

上传人: s**** 编号:157213 2024-03-16 17页 4.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
快手数据团队负责人靳国卫在DataFunSummit 2024峰会上分享了数据湖在快手的应用实践。快手面临数据膨胀、跨域协作效率低下等问题,通过建设数据湖,实现了成本和运维的优化。技术选型上,快手选择了Hudi,因为它相较于Delta Lake和Iceberg,具有更丰富的功能和更高的自动化程度。Flink集成方面,Hudi支持更新写多次读,而Delta Lake和Iceberg则不支持。快手的数据湖应用经历了CDC数据同步、批流结合业务加速、架构升级数仓优化等阶段。通过数据湖的建设,快手的数仓复用性提高,引擎从批处理升级到支持批流结合,提升了数据统计和分析的时效性,满足了业务SLA诉求。此外,快手还通过构建统一的数据生态工具链,推广数据湖的应用,实现了成本缩减和时效提升。
快手数据湖应用挑战有哪些? 快手如何通过数据湖优化业务? 快手数据湖技术选型与推广策略是什么?
客服
商务合作
小程序
服务号
折叠