A5--白桂荣--基于大模型的智能代码检视在OpenHarmony场景的探索与实践.pdf-三个皮匠报告

1、基于大模型的智能代码检视在OpenHarmony场景的探索与实践白桂荣华为AI技术专家、自然语言处理算法专家白桂荣华为 AI技术专家自然语言处理算法专家华为算法工程师，中科院自动化所博士毕业，研究方向为自然语言处理，毕业后入职华为，专注研发智能化相关领域工作，涵盖代码检视、解释、注释、调试、mr摘要生成、ai搜索等任务，助力OpenHarmony研发作业效率和效能提升，重点负责自动化OpenHarmony存量与增量代码的智能检视业务。目录C O N T E N T S1.现状与挑战2.实践3.未来演进现状与挑战01 1 智能代码检视的价值 2 高质量语料匮乏的情况下的模型建设思路 3 如何降

2、低模型产生的误报现状与挑战-智能代码检视的价值全民化的生成式人工智能全民化的生成式人工智能AIAI增强开发增强开发Gartner预测：到 2026年超过80%的企业将使用生成式人工智能的API、模型、应用。而在2023年初这一比例不到5%。预计到2027年，70%的专业开发者将使用AI驱动的编码工具，包括代码生成、增强测试等从设计到代码的过程。而今天这个数字不到10%。-AI增强开发-全民化的生成式人工智能看趋势：生成式AI渗透率不断提高，AI驱动的开发将成为未来的主流现状与挑战-智能代码检视的价值看趋势：AI驱动的代码仓：快速发展-GitHub Copilot：2023年DevSecOps报

3、告：-有62%的开发者使用AI来检查代码，比2022年的51%有所上升。-有36%的开发者使用AI进行代码审查，比前一年的31%有所上升。计划通过将AI辅助工作流应用于用户，将DevSecOps工作流效率提高10倍。在实现阶段如写代码、文档等的AI增强工具较多，在代码提交和评审活动中工具较少，但是发展较为迅速。目前多个厂商如gitlab和github已推出相关功能。已发布 Copilot for Pull Requests，提供了AI协助编写PR描述、团队代码审查工作、issue解决、PR补全修复、测试补全等功能。-GitLab：现状与挑战-智能代码检视的价值创建MR扫描代码review合入代

4、码MR信息需求/规范commit阅读检视意见提出比例需求64.4%(其中开发者61.8%，Commiter77%)阅读他人代码，理解代码逻辑58.9%(其中开发者61.8%，Commiter77%)检视他人代码并提出价值建议57.5%(其中开发者65%，Commiter44%)等待其他同事帮忙检视或合入用户调研TOP3耗时活动MR平均创建至合入时长：1个小时耗时占比89%智能review代码问题代码行定位与代码问题描述提供修改建议已合代码召集专家代码review更新代码提出现状与挑战-高质量语料匮乏的情况下模型建设思路高质量数据获取难-典型bad case：无意义的review意见真实例子：经

5、检视，无意见。-典型bad case：指示不清真实例子：这些都是什么鬼-典型bad case：非编码相关内容真实例子：需确认现网部署是否有修改的可能跟XXX对一下这块的改动方案待评审-典型bad case：相似内容反复提真实例子：同上-典型bad case：图片或网页链接，易造成幻觉真实例子：!image(/uploads/0cc83bf2-4eac-45b8-8b7c-a8e74034edf6/1690362601472.png-典型bad case：不知所言的review意见真实例子：?（直接打个问号）现状与挑战-高质量语料匮乏的情况下模型建设思路思路：（a）关键词过滤、人工标注训练分类器

6、、co-teaching去噪“同上”、“https:/xxx”、“这里删了”（b）标签改写改写前：“你这样用性能太低了，改成用IN来查改写后：collect 可能为大数据量,建议优化查询,避免全量查询。请考虑使用 SQL 的 IN 语句进行批量查询,以提高性能。（c）思维链无思维链：新增判断minLimit maxLimit 有思维链：这段代码在做边界检查，比较minLimit和maxLimit时，如果minLimit大于maxLimit，直接返回，这可能导致后续的判断逻辑出现问题。建议在这里抛出异常，或者提前检查参数的有效性。现状与挑战-如何降低模型产生的误报-大模型反思过滤-强化学习dp

A5--白桂荣--基于大模型的智能代码检视在OpenHarmony场景的探索与实践.pdf

相关报告