1、2025 研发效能基准数据洞察与AI 应用+度量闭环任晶磊思码逸任晶磊思码逸创始人兼 CEO 清华大学计算机系博士;前微软亚洲研究院研究员,斯坦福大学访问学者 软件研发效能度量规范标准核心起草专家 多篇论文发表在 FSE、OSDI 等顶级国际会议上 曾参与微软下一代服务器系统架构设计,获 4 项美国发明专利 研发大数据平台 Apache DevLake 开源项目发起人目录CONTENTS1.2025 研发效能基准数据洞察2.企业个性化 AI 成效度量3.研发应用 AI 的切入点与落地闭环每年一度中国研发效能数据调研,从工具中提取客观数据。2025 年统计 200+企业,18 个典型研发效能指标
2、的基准线。涵盖软件研发效能度量规范三个主要认知域:交付速率、交付质量和交付能力。DevData 2025 研发效能数据基准调研DevData 2025 研发效能基准数据(部分)认知域指标(单位)平均值IQR交付效率需求交付周期(天)247 30需求颗粒度(代码当量)69926 584代码生产率(代码当量/人月)42302768 5083代码贡献均衡度35%29%41%代码提交颗粒度(代码当量)1258 118交付质量单元测试覆盖度14.0%9.1%19.7%注释覆盖度37.3%30.0%44.1%代码不重复度78.9%77.8%84.9%重点问题密度(个/千当量)4.531.0 3.7千当量缺
3、陷密度(个/千当量)3.550.01 2.41缺陷修复工作量(代码当量)907 89函数圈复杂度(10 以下函数占比%)97.8%97.3%98.5%数据洞察:企业规模不同规模企业的代码生产率:敏捷 vs.组织管理企业规模越大,越需要关注团队代码贡献均衡度39%32%31%0%20%40%60%100人以内100-499人500人以上代码贡献均衡度不同规模企业的代码贡献均衡度中位值5079310438800200040006000100人以内100-499人500人以上代码生产率不同规模企业的代码生产率中位值数据洞察:AI 应用阶段37%13%11%9%7%6%6%11%你所在企业将 LLM
4、或基于 LLM 的工具主要应用于研发的哪些阶段?编码阶段业务规划设计阶段需求阶段测试阶段运维阶段其他还没有落地35524173010002000300040005000尚未应用LLM已落地应用LLM代码生产率LLM 落地应用与代码生产率中位值数据洞察:LLM 的应用效果(效率)已应用 AI 的企业代码生产率高于尚未应用的企业,但效率提升幅度低于20%,当量数据与主观评价一致+17%34%31%25%5%4%0%10%20%30%40%80%企业占比LLM 应用于研发后的实际效率提升情况研发应用 AI 的闭环开发流程测试流程效能成果效能标人在 IDE 中指挥 AI 干活算清 ROI,完成目标“程
5、序员的一天”工作坊,找到 AI 的发力点“共性”不变:结果度量 工程规范:人与 AI 协作及可观测性 例如:规范提交占比 业务影响:AI 价值的最终体现 例如:在控制需求颗粒度(代码当量)前提下,需求吞吐率和交付周期的变化效能度量中的共性LLM 的应用效果(质量)应用 LLM 后,质量提升不明显的企业占比高(40%)API 智能测试,以 DevChat Tester 为例:生成单用例成本 90%LLM 能力-确定性-可用性API测试用户需求40%33%13%6%4%4%0%10%20%30%40%50%不明显80%企业占比LLM应用于研发后的实际质量提升情况网址:客服:400-8637-426感谢您的关注思码逸:专业的研发效能数智化平台关注公众号,获得最新资讯欢迎至 B3 展位抽奖、咨询添加小逸预订 2025 研发效能基准报告