当前位置:首页 > 报告详情

3-2 深入解读 Flink CDC 增量快照框架.pdf

上传人: 云闲 编号:102346 2021-01-01 35页 2.62MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Flink CDC(Change Data Capture)技术,它是基于数据库的日志CDC技术,可以实现全量和增量的一体化读取能力。Flink CDC利用了Flink优秀的管道能力和丰富的上下游生态,支持实时捕获、加工多种数据库的变更并输出到下游。 关键点如下: 1. Flink CDC技术实现了全量和增量数据的一体化读取,借助Flink的管道能力和丰富的生态,支持实时捕获和加工多种数据库的变更。 2. Flink CDC 1.0在全量读取阶段不支持checkpoint,导致同步全量数据时,如果作业失败需要重新开始,重新读取5个小时。 3. Flink CDC 1.0的痛点:一致性通过加锁保证,但不支持水平扩展;全量读取阶段不支持checkpoint。 4. Debezium在保证数据一致性时,需要对读取的库或表加锁,可能导致数据库 hang 住,表级锁会锁住加锁的表(无法更新),DBA 一般不给锁权限。 5. Flink CDC 1.0 只支持单并发,在全量阶段读取阶段,如果表非常大(亿级别),读取时间都在小时级别。 6. Flink CDC 增量快照算法通过无锁读取、并行读取、断点续传等技术,解决了Flink CDC 1.0的痛点,实现了全增量一体化。 7. Flink CDC 发展规划:已支持MySQL CDC、Postgres CDC,未来将支持更多数据库,如Oracle、TDSQL等,并完善增量快照框架,推广生态集成,支持实时计算等。
"Flink CDC如何实现全量和增量一体化读取?" "Flink CDC的增量快照算法有哪些优势?" "如何评价Flink CDC在数据库日志CDC领域的贡献?"
客服
商务合作
小程序
服务号
折叠