当前位置:首页 > 报告详情

6-李本超-Flink SQL 在字节跳动的优化 & 实践-LYS.pdf

上传人: li 编号:29338 2021-02-07 38页 62.44MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动在 Flink SQL 优化与实践方面的经验。文章首先回顾了 Flink SQL 在字节跳动的发展历程,从 2018 年底 Blink 开源到 2020 年底基于 1.11 版本的 Streaming SQL 平台上线,展示了字节跳动在 Flink SQL 上的持续投入和技术进步。 文章重点讨论了以下几个方面的优化和实践: 1. Window 优化:通过 Mini-Batch Window Aggregation 减少了 CPU 开销,实现了简单窗口聚合和自定义窗口的需求。 2. 维表优化:介绍了延迟 Join、Keyby 和广播维表等优化策略,以及针对不同规模和更新频率的维表的优化方法。 3. Join 优化:提出了 Join 操作的优化方案,包括 Dimension Table Optimization 和 Lookup Join Operator 的优化。 4. 增强 Checkpoint 恢复能力:讨论了 Checkpoint 恢复过程中遇到的问题和改进方案,如 Source Sink 算子并行度变化、维表算子前面变成 keyby 等情况下的链路优化。 5. 流批一体:展望了流批一体的未来工作,如支持所有类型聚合指标变更的 Checkpoint 恢复能力、事件时间的 Fast Emit、更多算子的 Mini-Batch 支持等。 6. 未来规划:计划支持更多功能优化和场景,如推动流式 SQL 达到 80% 的覆盖率、探索落地流批一体产品形态、推动实时数仓标准化等。 总之,字节跳动通过在 Flink SQL 上的优化和实践,实现了更高效的数据处理和分析,为业务带来了价值。
"Flink SQL 在字节跳动如何优化与实践?" Flink SQL 如何实现数据同源与计算同源?" 有哪些亮点与期待?"
客服
商务合作
小程序
服务号
折叠