当前位置:首页 > 报告详情

张杨-Flink在B站的多元化探索与实践.pdf

上传人: 云闲 编号:101899 2021-01-01 42页 6.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了B站利用Flink进行多元化探索与实践的平台建设,包括基础功能完善、提交器优化、新任务构建模式、算子化智能诊断、错误分析与自动调优等方面。其中,关键点有: 1. 平台建设:完善了kafka动态sink、提交器优化、新任务构建模式等功能,支持sql与jar混合构建任务。 2. 资源优化:通过资源自动配置和任务启动加速等策略,实现了资源的高效利用,节省了线上约10%的资源。 3. 智能诊断:构建了性能诊断和失败诊断系统,根据运行时节点metrics自动分析任务倾斜、state内存、cpu配置等问题,提高任务稳定性。 4. 数据架构:采用Flink计算层、HUDI/HIVE存储层和增量管道,实现了数据的高效处理和实时追加,提高了数据使用效率。 5. AI On Flink:探索了时效性低的传统离线架构和时效性高的实时架构,提出了流批融合的解决方案,支持实时离线两套运行模式。 综上所述,B站通过Flink平台的建设,实现了资源优化、任务稳定性和数据处理效率的提升,为未来的实时离线数据处理和AI应用奠定了基础。
"Flink在B站实践如何?" "增量化架构如何提升数据效率?" "AI On Flink有哪些挑战和解决方案?"
客服
商务合作
小程序
服务号
折叠