当前位置:首页 > 报告详情

2017年airbnb数据平台实践.pdf

上传人: 云闲 编号:92372 2021-01-01 64页 5.23MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Airbnb数据平台的发展和关键技术。Airbnb采用单一HDFS、MR和Hive安装,通过c3.8xlarge实例和800个节点实现数据管理。面临挑战包括生产与临时查询之间的隔离性有限、难以满足服务级别协议、灾难恢复困难等。解决方案包括增量数据复制ReAir、统一流式和批量处理AirStream。ReAir通过记录和运行源数据的变化实现增量复制,而AirStream提供统一API,支持流式和批量处理。Airbnb还使用HBase作为全局状态存储,支持丰富的读写操作。此外,Airbnb还开发了AirPal和SuperSet等工具,以简化数据管理和分析。通过采用这些技术和策略,Airbnb成功实现了高效、可扩展的数据平台。
"Airbnb如何实现数据平台的演进?" "如何在Airbnb实现增量数据复制?" "Airbnb如何统一流式处理和批量处理?"
客服
商务合作
小程序
服务号
折叠