当前位置:首页 > 报告详情

蔚来李宇彬-基于 Paimon 的实时湖仓实践.pdf

上传人: Fl****zo 编号:624573 2025-03-31 31页 3.58MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了蔚来汽车实时湖仓架构的演进,由资深工程师李宇彬主讲。演讲分为四个部分:实时湖仓架构的演进、引擎底座实践及增强、平台化体系建设、未来规划。 1. 实时湖仓架构的演进:蔚来基于Paimon实时湖仓,实现分钟级流批一体。传统数仓与Paimon相比,在存储与计算引擎耦合、技术栈复杂性、实时数仓存储成本等方面存在不足。Paimon支持partial-update、deduplicate等策略,丰富的cdc入湖功能,以及高吞吐、低时延的LSM架构。 2. 引擎底座实践及增强:蔚来在引擎底座实践方面,进行了桶策略优化、数据订正、任务迭代、数据打宽等操作。同时,在引擎底座增强方面,引入了谓词下推、部分更新、动态桶等优化措施,提升了存储底座的稳定性、任务迭代速度和数据产出准确性。 3. 平台化体系建设:蔚来在平台化体系建设方面,基于系统表获取内置元数据,实现配置表属性加入自定义元数据。同时,构建了存储底座稳定性、数据产出准确性、流转可观测性等方面的平台。 4. 未来规划:蔚来计划引入Flink物化表,替换消息接入层Kafka,增强数据订正支持,加强血缘建设,提升问题源头排查效率,以及加强权限建设和全面审计等。 总之,蔚来通过实时湖仓架构的演进、引擎底座实践及增强、平台化体系建设以及未来规划,不断提升数据处理效率和稳定性,降低开发门槛,为业务发展提供有力支持。
"实时湖仓架构如何演进?" "Paimon 实时湖仓有哪些优势?" "实时湖仓未来将如何规划?"
客服
商务合作
小程序
服务号
折叠