当前位置:首页 > 报告详情

【B站】B站大数据多级存储实践-bilibili.pdf

上传人: 张** 编号:153274 2024-01-15 33页 2.65MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了B站大数据的多级存储实践,包括背景介绍、数据调度实践、冷数据降本实践、缓存加速实践和未来展望。B站大数据整体架构图显示,B站大数据总体存储量超过1EB,元数据总量达到150亿,节点总量近10000台,总请求数超过250亿。数据调度实践旨在解决元数据量过大、集群热点导致性能下降、支持多机房数据放置和冷数据转储等问题。冷数据降本实践通过归档存储和Erasure Coding技术实现,提高存储效率。缓存加速实践通过改造HDFS Client和HDFSRouter服务,引入CacheManager,定制Alluxio存储,提升数据读取速度和稳定性。未来展望包括在DataNode上实现local cache解决热点Block问题、直写Alluxio异步持久化至HDFS、支持continuous layout EC解决IOPS放大问题以及改造EC转换方式,进一步提升EC占比。
"B站大数据存储架构揭秘" "如何实现冷热数据高效调度?" "Alluxio缓存技术加速HDFS读取"
客服
商务合作
小程序
服务号
折叠