当前位置:首页 > 报告详情

2018年Uber搭建基于Kafka的跨数据中心复制平台.pdf

上传人: 云闲 编号:95399 2021-01-01 46页 1.91MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Uber如何在Apache Kafka上构建跨数据中心复制平台。Uber使用Kafka作为实时动态定价、欺诈检测、司机和乘客注册等众多用例的基础消息队列和流处理平台。Kafka的集群复制功能允许Uber在多个数据中心之间复制和同步数据,确保了高可用性和数据一致性。 文章详细描述了Uber内部开发的uReplicator,这是一个跨数据中心的复制和故障转移解决方案。uReplicator通过稳定的复制、简单的操作、高吞吐量、无数据丢失和可审计性等特点,解决了传统消息队列系统中的痛点,如昂贵的重新平衡、难以添加主题、可能的数据丢失和元数据同步问题。 此外,文章还讨论了uReplicator在处理数据复制过程中的性能问题,如追赶时间过长,以及如何通过增加批量大小、分区映射和动态负载平衡等技术来优化吞吐量。 Uber通过一系列的检测机制来确保数据的一致性和可靠性,包括在数据流经每个处理阶段时检测数据丢失,并保持时间戳偏移索引以支持基于时间戳的查询,同时从消费者的视角检测延迟。 为了实现可扩展性和自动化管理,Uber设计了联邦uReplicator,它可以通过多个路径进行扩展,并自动根据工作负载添加或移除复制器。 整体而言,Uber通过在Apache Kafka上构建uReplicator,有效实现了跨数据中心的数据复制和故障转移,提高了其服务的可靠性和效率。
"Uber如何构建跨数据中心复制平台?" "Apache Kafka在Uber的数据基础设施中扮演什么角色?" "uReplicator在Uber的Kafka数据复制中如何工作?"
客服
商务合作
小程序
服务号
折叠