当前位置:首页 > 报告详情

刘政宁-基于计图框架的代码大模型.pdf

上传人: 张** 编号:159301 2024-04-05 31页 3.74MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了计图(Jittor)在大模型训练、推理以及优化方面的突破和应用。计图实现了代码大模型的训练效果提升,包括历史、特点与挑战,深度学习框架计图,以及计图在代码大模型方面的探索。文章提到,计图支持多种大模型的训练与微调,相比Deepspeed+PyTorch,具有训练和微调速度提升20%,内存消耗减少30%的优势。计图还实现了显存优化,采用了零冗余优化器技术,将模型、优化器分片存储到不同GPU上,大大提升了显存高效利用。此外,计图语言大模型推理库降低了硬件配置要求,支持广,自主可控,并采用了动态swap机制和统一内存管理技术,实现了高吞吐量和低延迟。计图还推出了代码助手产品Fitten Code,速度和效果领先,能够实现最长上升子序列算法,并生成了ResNet的完整代码。总之,计图在大模型训练、推理和优化方面取得了显著成果,提供了高效、低成本的解决方案。
"计图如何提升代码大模型训练效果?" "Fitten Code如何实现长上下文支持?" "计图语言大模型推理库有哪些优势?"
客服
商务合作
小程序
服务号
折叠