王萌萌-美团增量湖仓Beluga的架构设计与业务实践.pdf

当前位置:首页 > 报告详情
王萌萌-美团增量湖仓Beluga的架构设计与业务实践.pdf

上传人: Fl****zo 编号:624558 2025-03-31 21页 1.25MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了美团数据湖架构团队负责人王萌萌关于美团增量湖仓Beluga的架构设计与业务实践的演讲内容。Beluga架构设计主要包括存储底座HDFS,两层分桶设计面向流、批不同负载,独立的MetaServer服务维护组织关系和管理表服务,以及支持Flink、Spark、Presto等引擎生态。在ODS数据入湖场景中,Beluga采用一表三模式,基于时间字段计算数据所属的时序分区,减少IO放大和存储成本。同时,Beluga支持流批一体的生产,实现流写和批读/写,提升数据新鲜度和计算存储成本。此外,Beluga还提供独立的MetaServer服务和灵活的Compaction策略,减轻元数据管理压力和客户端资源占用。业务实践方面,美团通过Beluga实现了分钟级数据可见,降低了资源需求和存储成本,并在医药某场景构建了基于数据湖的指标看板。未来计划包括提升能力丰富度、提供端到端的数据运维解决方案和推广至更多业务线,以及构建更友好的生产运维平台。
"Beluga架构如何优化数据存储?" "如何通过Beluga实现流批一体生产?" "Beluga在医药行业有哪些应用案例?"
客服
商务合作
小程序
服务号
折叠