当前位置:首页 > 报告详情

B站基于Iceberg构建秒级响应湖仓一体平台的技术实践.pdf

上传人: 2*** 编号:121868 2023-03-29 32页 4.85MB

报告标签

湖仓一体平台
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
B站基于Iceberg构建的湖仓一体平台,实现了秒级响应。该平台主要解决了Hive数仓的痛点,如查询性能不佳、出仓链路复杂、数据冗余和时效性差等问题。其目标是实现查询高效、使用便捷的湖仓一体架构。关键点包括:1. 使用Iceberg on HDFS、Flink、Spark SDK、Trino等技术构建平台。2. 优化查询加速,如使用MinMax统计信息、排序等手段提高过滤效果。3. 采用多种索引技术,如BloomFilter、Bitmap、Z-ORDER等,提高查询效率。4. 实现预计算,如Cube/AggIndex,用于聚合计算,减少global merge操作。5. 采用Star-Tree Index技术,优化多维度查询。6. 通过Magnus服务实现智能优化,如自动化智能化Iceberg表管理、智能推荐等。目前,B站的Iceberg表总量达5PB,日增75TB,Trino查询达20万/天,P95响应时间5s,过滤数据量达500TB/天。
"B站如何利用Iceberg实现湖仓一体?" "Iceberg表的索引技术有哪些创新?" "B站大数据平台如何实现智能优化?"
客服
商务合作
小程序
服务号
折叠