当前位置:首页 > 报告详情

王玺源《基于昇腾CANN的训推开源软件支持与实践》.pdf

上传人: 芦苇 编号:651751 2025-05-01 32页 3.59MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了基于昇腾CANN的训推开源软件支持与实践。主要内容包括: 1. 昇腾CANN的开源使能,全面支持业界AI框架,原生适配PyTorch社区版本。 2. vLLM开源大模型,以PagedAttention为核心算法,支持100+生成式大语言模型,与Hugging Face Transformers相比,吞吐量提升24倍。 3. vLLM支持多种硬件加速技术,如Paged Attention算法、Chunked Prefill、Prefix Cache、PD分离等,支持多种量化算法和自定义算子。 4. vLLM支持多种部署方式,如在线/离线、多机多卡、MP、Ray、Kubernetes等。 5. vLLM Ascend支持sleep mode特性,满足RLHF场景训推共卡需求,提升吞吐。 6. vLLM Ascend First RC Release for vLLM v0.8.4,支持多种部署方式,提升性能。
昇腾CANN如何支持大模型训练? vLLM如何实现多硬件平台上的高效运行? vLLM如何通过通信优化提升训练性能?
客服
商务合作
小程序
服务号
折叠