当前位置:首页 > 报告详情

2020年终大会-大数据架构:5-3.pdf

上传人: li 编号:29862 2020-12-01 35页 2.87MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大数据处理技术中Kafka的使用场景、管理挑战及未来发展趋势。文章指出,Kafka在处理交易数据、流量数据和业务行为数据等场景中具有重要应用,但在高SLA、低延迟要求下面临性能挑战。同时,Kafka在数据治理、topic生命周期管理、kafka user platform等方面存在运维困难。文章提出,应引入强Schema体系以解决通信字段变更的风险,并通过升级Kafka版本和优化mysql入kafka的延迟来缓解 connect集群导致的全局延迟。最后,文章展望了未来工作,包括跟进Kafka社区升级、将数仓的ods层切换到datalake技术以及探索Pulsar以解决超大规模流量的kafka集群扩容难题。
如何应对MySQL激进DDL对数据链路的影响? 如何解决Kafka生产/消费者通信的困难? 如何跟进kafka社区升级和探索新技术?
客服
商务合作
小程序
服务号
折叠