当前位置:首页 > 报告详情

华为:2025华为昇腾服务器 DeepSeek V3/R1 推理部署最佳实践技术报告(29页).pdf

上传人: d*** 编号:653844 2025-05-20 29页 3.53MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了华为昇腾服务器上部署 DeepSeek V3/R1 推理的最佳实践。主要内容包括: 1. 昇腾服务器和组网:介绍了昇腾芯片、Atlas 800I A2 服务器和 CloudMatrix 384 超节点的特点。 2. DeepSeek V3/R1 模型部署方案:介绍了基于 Atlas 800I A2 和 CloudMatrix 384 两种服务器的部署方案,包括模型量化策略、Prefill 和 Decode 分离部署、服务框架配置等。 3. 框架侧性能优化:介绍了 API Server 扩展技术、MoE 模型负载均衡等框架优化技术。 4. 模型侧性能优化:介绍了模型侧通信优化、模型侧并发方案、推理投机框架 FusionSpec 等模型优化技术。 5. 昇腾算子性能优化:介绍了 MLA 算子优化、MoE 通信算子优化等昇腾算子优化技术。 6. 性能分析:给出了 Atlas 800I A2 和 CloudMatrix 384 两种服务器上的性能分析结果。 7. 下一步工作:列出了后续需要完善和优化的方向。
昇腾服务器如何部署DeepSeek V3/R1模型? 昇腾服务器如何优化DeepSeek V3/R1模型性能? DeepSeek V3/R1模型在昇腾服务器上的性能如何?
客服
商务合作
小程序
服务号
折叠