当前位置:首页 > 报告详情

蒋思源-提升代码生成质量:代码大模型实践经验.pdf

上传人: 哆哆 编号:630906 2025-04-19 34页 15.22MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了aiXcoder大模型算法专家蒋思源在代码生成质量提升方面的实践经验。蒋思源关注如何通过大规模分布式训练获得更符合软件工程实际开发场景的基础代码大模型,并探索构建能符合软件开发流程、工具、行为的人类对齐训练方法。此外,他还关注如何在私有代码上做领域化增量训练,并尽可能降低灾难遗忘等问题。 关键点如下: 1. 蒋思源负责aiXcoder大模型开发全流程,包括数据采集与清洗、大模型构建与训练、模型推理优化及服务、模型评估等。 2. 他关注的基础代码大模型能更好地满足软件工程实际开发场景的需求。 3. 蒋思源提出的偏好对齐训练方法能提升代码质量。 4. 他在工程处理、领域化训练和生成代码质量评测等方面也有深入研究。 5. aiXcoder-7B-Base大语言模型在代码补全与生成方面取得了等量级下SOTA效果。
"如何提升代码生成质量?" "大模型算法专家的职责是什么?" "如何通过私有代码进行领域化增量训练?"
客服
商务合作
小程序
服务号
折叠