当前位置:首页 > 报告详情

顾小东-业务领域代码大模型深度探索与实践.pdf

上传人: p****n 编号:614118 2025-02-19 49页 6.62MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了如何将业务领域知识与大型语言模型(LLM)有效融合,以提升其在特定领域的代码生成能力。主要内容包括: 1. 背景:介绍基于大模型的程序自动生成面临的挑战,如大模型依赖海量训练数据,而专用领域的训练数据有限,导致大模型在特定领域的表现不佳。 2. 探究:通过实验分析大模型在特定业务领域的代码生成能力,发现大模型在专用领域的代码生成效果下降,主要因为缺少第三方库的知识,如API的使用方式。 3. 方法:提出三种策略将业务知识融入大模型,包括API知识外挂、思维链提示和思维链微调。实验结果表明,这些策略可以有效提升大模型在特定领域的代码生成能力。 4. 深入:基于思维链的正则表达式生成方法,通过将正则表达式分解成思维链,训练<自然语言,思维链>数据对,实现更准确的正则表达式自动生成。 5. 实践:介绍多粒度程序修复方法MGDebugger和基于LLM-Agent反思的Issue代码复现方法EvoCoder,通过任务拆解、子模块测试用例生成和基于LLM虚拟执行的子模块修复,实现复杂程序问题的修复。 综上所述,本文通过探究大模型在业务领域的表现,提出将业务知识融入大模型的方法,并在正则表达式生成和复杂程序问题修复方面进行了深入实践,为提升大模型在特定领域的代码生成能力提供了有效途径。
如何将业务知识融入大模型? 基于思维链的正则表达式生成方法是什么? 如何利用大模型进行仓库级代码修复?
客服
商务合作
小程序
服务号
折叠