1、华为ADC Code Agent评测实践陈永健陈永健华为 GTS平台测试总工19年华为运营商领域软件测试经验,6级专家,目前主要负责华为运营商软件数智化转型与AI云原生平台开发测试,长期专注测试技术发展,在AI大模型/Agent评测、混沌工程(鲁棒性测试)、生态兼容性测试、自动化测试、性能与仿真测试等领域有深入探索,支撑和保障全球300+运营商客户稳定运营。目录C O N T E N T S1.华为 ADC CodeAgent平台介绍2.CodeAgent 评测挑战与实践总体思路3.评测标准与体验一致性优化4.构建领域智码评测系统5.业务效果与下一步展望01华为 ADC CodeAgent平台
2、介绍从低码到智码,华为ADC应用开发平台ADC(Agent Development Center)是一个面向业务开发者低代码、安全可信的全场景开发平台,具备完整的资产生命周期管理工具链,提供以业务资产为核心的高效复用的新开发模式。企业场景生态伙伴低码开发应用智能运维智慧运营5G行业应用网络集成ADC:一体化编排应用开发平台低门槛/高效率可信安全生态开放 支持以图形化、类自然语言方式构造应用服务 开放流程、界面、数据、AI等多种编排能力,所见即所得 提供APP质量评估系统,保障APP高质量交付 提供端到端可信工具链,轻松构建可信APP资产 支持多协议、多引擎,随心构建、极速集成扩展 API集成图
3、形编排,集成资产全面复用共享支撑多场景基于低码编排快速实现业务应用学习资料多,高能耗集中开发者求助开销大写代码拖拉拽1高码2低码3智码输入简单不懂开发自然语言开发多模态设计即开发需求即应用Next智能推荐CUI/LUI0 码进入智码时代,体验变革:1.输入更简单:从代码 自然语言 多模态2.不需懂开发:从懂开发 懂业务now多轮澄清式开发运行即应用Level 4Level 3Level 2Level 1Level 0无智能化拖拉拽,无智能化智能辅助单一开发元素的智能辅助场景级智能辅助跨元素智能辅助,仍以人工开发为主有条件智能化以智能开发为主,人工做必要的辅助高度智能化限定的场景下,不需开发者完
4、全智能化全部不需开发者,自动完成开发智码等级当前目标L5华为 ADC Code Agent 智能化演进之路华为 ADC Code Agent 完整开发旅程的智码全景理解需求产生代码确认代码调试&测试发布反复迭代设计修改代码读懂代码查阅资料智能智能需求澄清器SA需求即应用智能续写/推荐存量转需求澄清存量修改和关联修改智能发现问题和自动优化多模态输入Copilot辅助生成 单个元素 端到端跨元素智能推荐辅助代码解释智能问答分段采纳测试用例自动生成智能化测试智能检测和自动优化验收存量修改难ST问题多调测耗时、易遗漏采纳代码难端到端生成难文字描述难完整开发旅程中,构建智码核心竞争力,还存在多个环节智能
5、提效缺失或不足,同时已有能力还需要进一步做深、做广。华为Code Agent 平台特性全景,端到端低门槛智能开发,更聚焦业务成功Code Agent让开发更简单需求Agent需求完整功能点设计Agent功能点设计方案作业Agent指令完成作业服务于人+服务于AgentTT单Agent大屏Agent测试Agent黑盒测试代码优化Agent修复Agent 均需考虑变更情况开发Agent设计方案代码搜读代码Agent搜读写代码Agent增DT Agent白盒测试改代码Agent改、删、重构质量Agent设计方案+代码验证结果运维AgentApp运维报告质量检测Agent检查盘古领域大模型CR单Age
6、nt横:场景类Agent纵:开发活动Agent 多模态沟通Next智能推荐Multi-Agent25年重点关键能力1234以可阅读文档为中间物,实现人和Agent协同大模型:领域理解/推理/推荐/多模态02CodeAgent 评测挑战与实践总体思路Code Agent 智码评测挑战测试集构建痛点 不同测试集分类,构建方法不一样;每一类测试集应该覆盖哪些维度;测试集规模和完备性如何确定和评估;测试集本身质量,如何评审评估优化评估标准痛点 每一类测试集评估方法和标准不一样;评估标准如何构建,符合用户要求;评估标准如何落地,并进一步实现自动化;验证效率痛点 测试集规模大,人工测试效率底;不同测试集自