当前位置:首页 > 报告详情

专场13.3-Presto在b站的性能优化-郭建华.pdf

上传人: 2*** 编号:126930 2023-05-01 36页 3.15MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Presto在B站的性能优化实践。作者郭建华,曾任职于携程大数据离线平台,现任B站大数据离线平台研发工程师。文章首先介绍了Presto集群现状,包括日查询量30W次,处理数据量20PB/天,1200+Worker,2 IDC/6 cluster等。然后重点阐述了Presto Local Cache的背景、热度统计、如何只缓存热表以及架构等。Presto Local Cache旨在减少网络传输,提高查询性能,通过开发标记服务和Presto内置的split机制实现热表缓存。其架构包括强依赖HMS的元数据缓存、主节点支持FileStatus cache、HDFS数据缓存到worker的SSD中、worker缓存orc/parquet的footer信息以及主节点软亲和调度等。此外,还解决了分布不均、缓存失效等问题。Presto Index部分则介绍了索引的背景、架构、各类索引以及如何自动构建索引等。最后,文章对比了Presto Index的性能,并提出了未来的改进方向。
Presto Local Cache如何解决缓存失效问题? Presto Index如何选择合适的索引类型? Presto Index有哪些性能对比优势?
客服
商务合作
小程序
服务号
折叠