当前位置:首页 > 报告详情

2、伍翀、徐榜江-Flink CDC 如何简化实时数据入湖入仓.pdf

上传人: 云闲 编号:101788 2021-09-01 39页 7.02MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Flink CDC(Change Data Capture)技术及其在实时数据入湖入仓中的应用。Flink CDC能够简化实时数据集成,支持多种数据源,如TiDB、Hologres、ClickHouse、Iceberg、Hudi等,并具有无锁读取、并发读取、断点续传等核心特性。Flink CDC的社区生态也在不断发展,2021年发布了5个大版本,贡献者和commits数量持续增长。 阿里巴巴内部实践了Flink CDC的改进,解决了手工映射表结构、复杂易出错的问题,以及schema变更导致的入湖链路难以维护的问题。用户希望的整库入湖开发量大、性能瓶颈等问题也得到了解决。通过一行SQL,一个Job实现全自动化数据集成。 未来,Flink CDC计划完善基于增量快照读取算法的通用框架,扩展更多CDC数据源,如Oceanbase、SQL Server等,并打磨Schema Evolution内核,为开源做准备。
"Flink CDC如何简化实时数据入湖入仓?" "Flink CDC的核心技术有哪些?" "Flink CDC在阿里巴巴内部的实践和改进有哪些?"
客服
商务合作
小程序
服务号
折叠