当前位置:首页 > 报告详情

肖松-大模型场景下智算平台的设计与优化实践.pdf

上传人: 张** 编号:177474 2024-10-01 27页 4.36MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大模型场景下智算平台的设计与优化实践。首先,文章介绍了智算平台的新特点,如参数爆炸导致的多机多卡成为常态,以及卡间和机间高性能通信的重要性。其次,文章指出了智算平台需要解决的问题,包括基础设施、调度、应用和运维方面的挑战。接着,文章详细讨论了技术实践,包括如何实现基础设施层的混合多芯、数据集处理加速、高性能存储和高性能网络,以及调度层的资源管理和调度逻辑、应用层的训练容错和推理加速等。最后,文章以百度百舸架构为例,展示了大模型场景下智算平台的发展和演进。
"智算平台如何应对大模型训练需求?" "如何优化大模型训练中的资源利用和调度?" "未来智算平台发展趋势与挑战是什么?"
客服
商务合作
小程序
服务号
折叠