当前位置:首页 > 报告详情

1-5 李呈祥-哔哩哔哩OLAP平台引擎演进实践.pdf

上传人: 2*** 编号:121594 2023-03-31 24页 1.23MB

报告标签

OLAP平台引擎演进实践
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
哔哩哔哩(B站)在其OLAP平台引擎演进中,经历了从业务分散自建到统一OLAP平台建设的转变。起初,面临缺乏完善接入工具和标准、多种OLAP引擎并存且维护使用成本高的挑战。B站首先选择ClickHouse作为其数据服务引擎,因其性能强大、功能丰富、支持多场景,并且业界大规模使用,社区活跃,稳定可靠。 在用户行为分析平台案例中,B站面对数据量超大、业务需求多样,采用64节点ClickHouse集群处理超千亿条数据/天的挑战。通过BulkLoad优化写入、Spark任务扩展、UserID字典映射、shard存储、数据聚合物化等手段,解决了大规模数据写入导致的稳定性问题和达到交互式查询性能的需求。 此外,B站还将文本检索迁移到ClickHouse,解决了ElasticSearch在写吞吐量、存储成本、数据分析能力方面的限制。通过ClickHouse内核层面的增强,如MapV2隐式列,B站实现了下一代日志体系的建设。 在湖仓一体实践阶段,B站通过湖仓一体架构,实现了计算存储分离,降低了数据同步冗余,并提升了查询性能和数据近实时可见性。湖仓一体带来了文件排序、索引、预计算等能力,并在日志平台、指标服务等方面有显著应用。 总之,ClickHouse和湖仓一体相互补充,为B站提供了强大的OLAP能力,满足了多维分析、文本检索等需求,并将继续演进以支持更高效的数据处理和分析。
如何利用ClickHouse实现湖仓一体? ClickHouse在OLAP场景中有什么优势? 如何优化ClickHouse集群的稳定性与性能?
客服
商务合作
小程序
服务号
折叠