当前位置：首页 > 报告详情

2018年Uber搭建基于Kafka的跨数据中心复制平台.pdf

上传人：云闲编号：95399 2021-01-01 PDF PDF 46页 1.91MB

该报告所属合集： 2017-2018年ArchSummit全球架构师峰会嘉宾演讲PPT合集

打包下载报告合集

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载报告到电脑，查找使用更方便

VIP专享文档

书签

分享

收藏

已收藏

版权投诉

/46

立即下载

word格式文档无特别注明外均可编辑修改，预览文件经过压缩，下载原文更清晰！

三个皮匠报告文库所有资源均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

《2018年Uber搭建基于Kafka的跨数据中心复制平台.pdf》由会员分享，可在线阅读，更多相关《2018年Uber搭建基于Kafka的跨数据中心复制平台.pdf（46页珍藏版）》请在三个皮匠报告上搜索。

1、How Uber Builds A Cross Data Center Replication Platform on Apache Kafka01 Apache Kafka at Uber02 Apache Kafka pipeline&replication03 uReplicator04 Data loss detection05 Q&AAgendaReal-time Dynamic PricingStreamProcessingDynamic pricing App ViewsVehicle InformationApache KafkaUber Eats-Real-Time ETAs

2、A bunch more.Fraud DetectionDriver&Rider Sign-ups,etc.Apache Kafka-Use CasesGeneral pub-sub,messaging queueStream processing AthenaX-self-service streaming analytics platform(Apache Samza&Apache Flink)Database changelog transportCassandra,MySQL,etc.Ingestion HDFS,S3LoggingData Infrastructure UberPRO

3、DUCERSCONSUMERSReal-time Analytics,Alerts,DashboardsSamza/FlinkApplicationsData ScienceAnalyticsReportingKafkaVertica/HiveRider AppDriver AppAPI/ServicesEtc.Ad-hoc ExplorationELKDebuggingHadoopSurgeMobile AppCassandraMySQLDATABASES(Internal)ServicesAWS S3PaymentPBsMessages/DayTrillionsData Tens of T

4、housands TopicsScaleexcluding replication01 Apache Kafka at Uber02 Apache Kafka pipeline&replication03 uReplicator04 Data loss detection05 Q&AAgendaApache Kafka Pipeline UberDC2DC1ApplicationsProxyClientKafka RESTProxyRegionalKafkaApplicationsProxyClientKafka RESTProxyRegionalKafkaSecondaryApache Ka

5、fkaAggregateKafkauReplicatorOffset Sync ServiceAggregateKafkauReplicatorAggregationRegionalKafkaRegionalKafkaAggregateKafkauReplicatorOffset Sync ServiceAggregateKafkauReplicatorDC1DC2Global viewCross-Data Center FailoverRegionalKafkaRegionalKafkaAggregateKafkauReplicatorOffset Sync ServiceAggregate

6、KafkauReplicatorDC1DC2During runtimeuReplicator reports offset mapping to offset sync serviceOffset sync service is all-active and the offset info is replicated across data centersDuring failoverConsumers ask offset sync service for offsets to resume consumption based on its last commit offsetsOffse

本文主要介绍了Uber如何在Apache Kafka上构建跨数据中心复制平台。Uber使用Kafka作为实时动态定价、欺诈检测、司机和乘客注册等众多用例的基础消息队列和流处理平台。Kafka的集群复制功能允许Uber在多个数据中心之间复制和同步数据，确保了高可用性和数据一致性。文章详细描述了Uber内部开发的uReplicator，这是一个跨数据中心的复制和故障转移解决方案。uReplicator通过稳定的复制、简单的操作、高吞吐量、无数据丢失和可审计性等特点，解决了传统消息队列系统中的痛点，如昂贵的重新平衡、难以添加主题、可能的数据丢失和元数据同步问题。此外，文章还讨论了uReplicator在处理数据复制过程中的性能问题，如追赶时间过长，以及如何通过增加批量大小、分区映射和动态负载平衡等技术来优化吞吐量。 Uber通过一系列的检测机制来确保数据的一致性和可靠性，包括在数据流经每个处理阶段时检测数据丢失，并保持时间戳偏移索引以支持基于时间戳的查询，同时从消费者的视角检测延迟。为了实现可扩展性和自动化管理，Uber设计了联邦uReplicator，它可以通过多个路径进行扩展，并自动根据工作负载添加或移除复制器。整体而言，Uber通过在Apache Kafka上构建uReplicator，有效实现了跨数据中心的数据复制和故障转移，提高了其服务的可靠性和效率。

"Uber如何构建跨数据中心复制平台？" "Apache Kafka在Uber的数据基础设施中扮演什么角色？" "uReplicator在Uber的Kafka数据复制中如何工作？"

全行业研究报告分享下载平台

0731-84720580
商务合作：really158d
友链申请 (QQ)：1737380874

关于我们

更多

关于我们

三个皮匠报告微信公众号

三个皮匠报告微信小程序

扫码咨询网站充值下载问题

友情链接：

营销自动化亿欧智库微播易阿里妈妈

copyright@2008-2013 长沙景略智创信息技术有限公司版权所有网站备案/许可证号：湘B2-20190120 | 工信部备案号：湘ICP备17000430号-2 | 公安备案号：湘公网安备43010402001071号

客服

小程序

服务号

折叠