《周晨程--B站视频素材库基于Ray的大规模计算加速优化与实践.pdf》由会员分享,可在线阅读,更多相关《周晨程--B站视频素材库基于Ray的大规模计算加速优化与实践.pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、例:支撑海量数据的大数据平台与架构 例:茹炳晟例:腾讯Tech Lead,腾讯研究院特约研究员正文要求:微软雅黑:最小字号 8号 宋体:最小字号 10号 等线:最小字号 12号B站视频素材库基于Ray的大规模计算加速优化与实践 周晨程bilibili资深开发工程师周晨程bilibili资深开发工程师B站视频素材库工程团队负责人,参与素材库离线处理链路的重构设计及改造,从0到1引入ray引擎结合业务进行落地加速,具有多年的云原生工程平台开发经验。CONTENTS目录1.业务背景与痛点 2.基于Ray的架构升级 3.技术难点与挑战 4.总结与未来展望业务背景与痛点业务背景AI能力内容体验+创作支持
2、 生成式AIAI视频理解数字人口播音色克隆场景一:智能剪辑场景脚本理解分镜设计分镜视频检索视频合成智能剪辑场景数据处理链路智能剪辑场景工程结构智能剪辑视频素材处理场景工程结构场景二:视频模型数据标注场景视频模型数据标注场景工程结构视频标注场景工程结构业务痛点与问题基于Ray+Iceberg的架构升级视频特征工程升级架构hdfs-视频文件iceberg-元数据ray-计算引擎iceberg-特征数据Ray简介UC Berkeley 的 RISElab发起简单、通用的分布式计算框架适合:细粒度的并行计算 异构计算Ray的优势简洁高效的分布式编程范式异构资源分离计算细粒度的并行计算弹性资源调度丰富的
3、Python生态基于Ray的工程架构Ray Job任务编排Actor Pool资源弹性整合资源接入层编程范式的改变更专注于业务逻辑研发效率明显提升通用轻量高效引入数据湖Iceberg优势iceberg数据组织结构iceberg对比hive的优势Iceberg Python生态技术难点与挑战任务并行化CPU预处理与GPU推理分离持久化与计算分离单机并行-分布式并行batch推理细粒度full batch率高infer次数少GPU利用率提高任务弹性节点弹性资源孤岛的形成节点弹性pending resource-scale upidle node-scale down总结与未来展望场景拓展AI Agent场景函数计算场景模型服务平台化思考目标:基于Ray提供通用计算底座挑战:提供多租户接入能力集群高可用提供per-job和session多种作业模式跨集群资源调度未来展望平台化:将Ray的能力平台化,离线资源收敛统一管控,为更多业务提供一站式接入。挖掘Ray在大模型分布式推理及训练等复杂场景的能力,尝试进一步深度集成。Ray社区:Ray将持续深耕于AI生态,提供更多开箱即用的工具,社区持续繁荣。随着人工智能技术的不断发展,Ray将继续引领分布式计算领域的发展潮流。感谢聆听关注SECon公众号