GIAC_施晓罡_基于Flink的高可靠ETL系统.pptx

编号:30027 PPTX 29页 11.26MB 下载积分:VIP专享
下载报告请您先登录!

GIAC_施晓罡_基于Flink的高可靠ETL系统.pptx

1、基于Flink的高可靠实时ETL系统,施晓罡,实时计算平台Oceanus,一站式提供从数据接入、应用开发、测试验证、应用部署到线上运维的全生命周期管理,实时计算平台Oceanus,一站式提供从数据接入、应用开发、测试验证、应用部署到线上运维的全生命周期管理,实时计算平台Oceanus,一站式提供从数据接入、应用开发、测试验证、应用部署到线上运维的全生命周期管理,实时数据接入Oceanus-ETL,游戏娱乐,社交网络,网络媒体,即时通讯,移动应用,互联网金融,TDBank实时接入,数据清洗,格式适配,缓存分发,数据聚合,文件加密,数据质量,TRC实时计算,TDW分布式数据仓库,实时数据接入Oce

2、anus-ETL,Tube,文件,数据库,TCP/UDP,消息中间件,消息分拣,TDManager 配置中心,Flink,Hive HBase ES,数据存储,Master,实时数据接入Oceanus-ETL,40万亿,日接入消息数,6PB,日接入数据量,每秒接入消息数峰值,4亿,实时数据接入Oceanus-ETL,2012 TDBank上线 基于Jstorm实现,支持Hive和HBase,2017 TDBank 2.0 基于Flink进行重构,提高作业可靠性,2020 TDBank 3.0 全实时链路 支持端到端Exactly-Once 通过Iceberg提供更新能力,实时数据接入Ocean

3、us-ETL,挑战,低延迟和高吞吐 端到端的Exactly-Once保证 负载均衡 灾备容错,利用Flink实现端到端Exactly-Once,Tube,Flink,HDFS,Flink,Flink,Flink,Ledger,指标聚合,通过Flink的checkpoint机制实现两阶段提交,避免在作业故障时导致的数据重复 通过Event-time对数据链路的各个环节的指标进行统计并对账 当对账成功之后,创建分区;否则告警,利用Flink实现端到端Exactly-Once,基于Chandy-Lamport算法实现checkpoint,Master,Worker,利用Flink实现端到端Exactly-Once,在完成对齐之前,再从这个channel获得的数据将被缓存起来,当收到所有输入的barrier之后,任务保存自己的状态,并将barrier发送给下游,保存好的快照被发送给Master。当

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(GIAC_施晓罡_基于Flink的高可靠ETL系统.pptx)为本站 (X-iao) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠