当前位置:首页 > 报告详情

A2--董汉德--代码大模型的训练及发展趋势.pdf

上传人: 可*** 编号:710749 2025-05-28 37页 3.40MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯AI产品技术专家董汉德在代码大模型训练方面的技术分享。关键点如下: 1. 大模型训练方法论:包括预训练、后训练和强化学习,以获取知识、对齐人类偏好和需求,以及探索更优方案。 2. 数据驱动大模型发展:代码领域数据量大、质量高,易于推进智能化。 3. 代码大模型产品定位:辅助编程,提高程序员效率,具备代码补全、智能改写和需求实现等功能。 4. 数据来源与质量过滤:数据来源于代码托管平台、代码论坛和通用数据,通过规则和模型过滤提高数据质量。 5. 代码大模型评估:离线评估和线上AB实验评估,关注模型在代码采纳率、生成率等指标的表现。 6. 模型优化:专家驱动和用户驱动的优化,如跨文件训练、符合用户行为偏置的数据构造等。 7. 技术发展主张:强化学习增强Agent能力,代码领域先行,未来可推广到通用领域。 核心数据:文章提及的代码大模型如StarCoder、Codellama和Deepseek Coder等,在数万亿个tokens上进行预训练。
"编程利器CodeBuddy如何助力?" 大模型有哪些亮点?" "代码智能化,未来将如何发展?"
客服
商务合作
小程序
服务号
折叠