当前位置:首页 > 报告详情

基于CodeFuse的下一代研发探索-姜伟.pdf

上传人: 张** 编号:153239 2024-01-15 35页 8.99MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了基于CodeFuse的下一代研发探索,蚂蚁集团高级算法专家姜伟基于CodeFuse的下一代研发探索,包括蚂蚁CodeFuse代码大模型、蚂蚁LLM应用于研发的现状、未来展望蚂蚁CodeFuse代码大模型大模型适合研发型智力活动吗? 核心数据: 1. 超过2000开发者调研结果显示,基于GPT模型的Copilot可以提高开发者的工作效率和满意度。 2. CodeFuse代码大模型发展历程:2022年至2023年,经历了从0.25B模型到支持多语言、多IDE的1.0版本,再到支持代码补全、解释代码等任务的3.0版本。 3. CodeFuse模型架构和训练数据:采用BPE Tokenizer避免OOV,Data Pack提升训练效率,MMap数据预索引等技术。 4. CodeFuse在IDE插件、AI Native IDE、数据分析器等多场景的应用。 关键点: 1. 大模型可以助力研发,提高开发者工作效率。 2. 蚂蚁集团在CodeFuse模型上的研发成果,包括支持多语言、多IDE的代码补全IDE插件,开源代码大模型HumanEval榜单(74.4%)等。 3. CodeFuse模型的训练数据特点,如各语言分布不均匀、代码未格式化等。 4. 未来展望,包括Gartner 2024重要战略技术趋势、基于自然语言的端到端软件开发等。 综上,本文主要介绍了蚂蚁集团基于CodeFuse的下一代研发探索,包括CodeFuse代码大模型、蚂蚁LLM在研发中的应用现状和未来展望。通过调研数据和实际应用案例,展示了大模型在研发中的重要作用和潜力。
"蚂蚁集团如何利用CodeFuse提升研发效率?" 从助手到协同伙伴" "CodeFuse在软件开发全生命周期的应用与实践"
客服
商务合作
小程序
服务号
折叠