当前位置:首页 > 报告详情

1-3 STRONGHOLD:快速实惠的亿级深度学习模型训练.pdf

上传人: 云闲 编号:102308 2021-01-01 26页 3.38MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了STRONGHOLD,一种快速、经济的十亿规模深度学习模型训练方法。STRONGHOLD通过在模型训练过程中动态地将数据从CPU传输到GPU,并使用影子张量技术高效传输数据,实现了模型规模的显著提升。实验结果显示,在32GB V100 GPU上,STRONGHOLD将可训练模型大小提高了1.9x至6.5x,并将训练吞吐量提高了1.2x至3.7x。此外,STRONGHOLD还在多个NLP任务中取得了优异的性能,如条件式生成模型、多语言理解和生成模型、端到端多模态预训练模型等。这些成果展示了STRONGHOLD在NLP领域的广泛应用和巨大潜力。
"如何实现深度学习模型的高效训练?" "如何通过异构资源提升深度学习模型性能?" "STRONGHOLD模型在NLP领域有哪些突破性成果?"
客服
商务合作
小程序
服务号
折叠