《专场21.3-面向资效平衡的机器学习平台的演进-高会军.pdf》由会员分享,可在线阅读,更多相关《专场21.3-面向资效平衡的机器学习平台的演进-高会军.pdf(16页珍藏版)》请在三个皮匠报告上搜索。
面向资效平衡的机器学习平台的演进高会军+小红书云原生负责人大纲 背景 解决方案 成果展示 未来规划背景Inspire Lives,分享和发现世界的精彩每天百亿次笔记曝光超过2亿月活国内优选的生活分享社区背景遇到的问题背景MLOps发展趋势MLOps+FinOpsCI/CD 流水线自动化ML 流水线自动化自动构建、测试新的pipeline组件并将其部署在目标环境成熟度级别2成熟度级别1资效平衡成熟度级别3手动过程通过自动执行机器学习流水线来持续训练模型构建和部署机器学习模型的过程完全是手动成熟度级别0背景建设资效平衡的机器学习平台解决方案整体建设情况解决方案模型部署serverless容器管理引擎kubernetes解决方案离线调度新增调度能力:大套餐优先调度、queue资源保障、CVM和公有云容器实例服务混合调度等,大幅度提升装箱率。解决方案计算资源性能优化解决方案数据加速解决方案资源管理策略成果展示 降低用户使用门槛,实现了低代码模型开发 模型训练效率提升 100%提供一整套覆盖从推理到训练的云原生高性能异构计算解决方案,更好地支持批处理作业和高性能服务,进一步提升资源使用效率和降低运维管理复杂性未来规划 协同社区,进一步探究如何在云原生场景下更好地支持批处理作业和高性能作业 实现无差别混部