当前位置:首页 > 报告详情

钟宇江-实时洞察湖仓之力-0702.pdf

上传人: 张** 编号:169161 2024-07-06 22页 1.83MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了小米基于 Apache Paimon 的实时湖仓架构探索。当前小米的实时湖仓计算框架以 Flink + Talos + Iceberg 为主,但存在实时计算成本高、架构复杂、作业稳定性差和存储成本高等痛点。Paimon 作为一种创新技术,将 LSM 结构融合到 Lakehouse 架构中,有效应对流处理语义挑战,同时对批处理及 OLAP 也有不错的支持。文章通过三个探索场景,详细介绍了使用 Paimon 优化 Stream join、Streaming upsert 和 Lookup Join 的方法和预期收益。总体来看,使用 Paimon 可以降低计算成本、简化架构、提升作业稳定性,并统一数据链路。未来,小米将继续挖掘 Paimon 在流计算场景下的应用,并致力于自动化的 Maintance 服务和智能优化。
"Paimon如何优化Stream join?" "如何解决实时湖仓架构的痛点?" "Paimon在流计算场景下的应用前景如何?"
客服
商务合作
小程序
服务号
折叠