当前位置:首页 > 报告详情

大模型时代的异构计算平台- 孙鹏v2.pdf

上传人: 张** 编号:153108 2024-01-15 42页 9.16MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了大模型时代的异构计算平台GPT-3,以及它如何开启大模型时代。文章首先指出,GPT-3的1750亿参数模型带来了质的效果飞跃,能够处理各种新任务,如数学计算、阅读理解、多轮问答等,显示出大模型带来的AI通用性显著提升。接着,文章详细阐述了超大模型训练对基础设施的需求,包括软硬结合的联合优化、大模型发展推动基础设施演进等。文章还介绍了大模型训练中的技术挑战,如算力墙和存储墙,以及解决这些挑战的方法,如数据并行、流水线并行、张量并行等。最后,文章指出大模型发展将推动基础设施的演进,包括参数规模的持续增加、算力需求的增长以及多模态训练等。
大模型时代如何应对算力挑战? 软硬件结合如何优化大模型训练? 大模型发展如何推动基础设施演进?
客服
商务合作
小程序
服务号
折叠