当前位置:首页 > 报告详情

optimize-llm-workflows-with-smart-infrastructure-enhanced-by-volcano-chuan-hui-volcanozha-xia-27dya-shi-llmxiao-xin-li-qihoo360-xuzheng-chang-huawei-cloud-technologies-co-ltd.pdf

上传人: 山海 编号:627296 2025-04-21 21页 5.60MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了华为云通过 Volcano 增强的智能基础设施来优化大型语言模型(LLM)的工作流程。背景部分指出,自2023年以来,LLM受到的关注日益增加,使用Kubernetes进行LLM基础设施优化的实践也在增多。现状部分展示了使用Kubernetes支持LLM的现状,包括用户数量、集群规模、资源使用情况以及任务类型的复杂性。存在的问题主要包括故障、效率低下和易用性差。文章提出了使用Volcano项目来解决这些问题,Volcano是华为开源、CNCF孵化的项目,它弥补了Kubernetes原生调度策略的不足,支持多种计算资源和训练框架,以及多种调度策略的组合。文章详细介绍了Volcano如何通过新的资源抽象、队列支持、作业流、调度策略等提升LLM工作流程的效率和易用性,并解决了故障处理、资源抢占、任务排队等关键问题。
如何优化LLM工作流程? Volcano项目如何解决Kubernetes原生不足? 有哪些策略可以提升LLM任务效率和易用性?
客服
商务合作
小程序
服务号
折叠