当前位置:首页 > 报告详情

大规模预训练模型高效训练的构架实践-张杰.pdf

上传人: 2*** 编号:127442 2023-05-01 36页 6.04MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了模型训练的趋势和挑战、分布式框架Whale的介绍及其实践示例和效果、超大模型训练最佳实践。 关键点如下: 1. 模型训练趋势:模型参数规模越来越大,训练数据越来越多,对算力的需求也在增加。 2. 挑战:当前使用最广的模型训练框架是Tensorflow和PyTorch,但它们支持的并行策略有限,迁移代价高,学习成本大。 3. 分布式框架Whale:Whale是一个统一多种并行策略、灵活易用的分布式深度学习训练框架。它支持多种并行策略,接口灵活易用,可以自动并行策略探索,分布式性能更优。 4. Whale实践示例和效果:Whale在大规模分类、Bert large模型等场景中取得了良好的效果,如64卡混合并行性能提升14.8倍,Bert large数据并行性能提升1.74倍。 5. 超大模型训练最佳实践:以最大中文多模态模型M6为例,介绍了稀疏计算优化、分布式训练策略、显存优化等技术,实现了在超大模型训练中的高效计算和资源利用。 总结:本文阐述了模型训练的发展趋势和面临的挑战,介绍了Whale这一分布式训练框架的特点和实践效果,以及超大模型训练的最佳实践方法。
"Whale框架如何提升模型训练效率?" "如何使用Whale实现大规模模型的分布式训练?" "Whale框架在中文多模态模型M6训练中的应用效果如何?"
客服
商务合作
小程序
服务号
折叠