当前位置:首页 > 报告详情

2024龙蜥大会中兴通讯分论坛:大模型时代的智算基础设施演进趋势探讨-杨维.pdf

上传人: 张** 编号:175512 2024-09-11 21页 4.85MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大模型时代的智算基础设施演进趋势。首先,文章指出训练端超万卡集群的挑战及演进,包括模型参数的快速增长、超大规模算力成为未来发展主旋律、以及大模型训练对智算中心互联提出更高要求。接着,文章讨论了推理端多场景挑战及技术演进,包括如何选择推理卡实现最优性价比、如何实现高效推理、如何实现训推解耦以及如何应对多场景推理的关键挑战。最后,文章介绍了中兴通讯的智算方案与实践,包括一机多卡、软硬解耦、多元算力、开放合作、全栈软硬件智算产品和集成方案等。
智算基础设施如何应对大模型时代的挑战? 推理端如何实现高效推理和混池推理? 异构GPU如何实现统一管理和调度?
客服
商务合作
小程序
服务号
折叠