当前位置:首页 > 报告详情

vescale-a-pytorch-native-llm-training-framework-vescaledaeppytorch-chang-llmxiao-zhen-hongyu-zhu-bytedance.pdf

上传人: 山海 编号:627323 2025-04-21 20页 1.41MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动团队开发的自动并行训练框架VeScale,旨在解决PyTorch原生模型训练中的人工维护成本高、调试难度大等问题。VeScale能够自动生成多维并行计划,简化分布式训练模型checkpoints的处理,降低对人工的依赖。关键数据包括:单个模型训练所需数周时间、VeScale带来的性能提升(如4D分布式训练下的Bitwise正确性测试中,Mixtral LLama2模型使用VeScale相较于PyTorch TP有1.2~1.3倍的加速)。未来,VeScale计划提升易用性和性能,并扩展支持更多PyTorch算子。项目开源,旨在构建高性能、易用的自动并行训练社区。
"VeScale如何实现自动并行训练?" "VeScale的设计与实现有哪些亮点?" "VeScale的初步测试结果如何?未来展望是什么?"
客服
商务合作
小程序
服务号
折叠