1、全球软件测试技术峰会9月北京始于所见,达于所思:微信终端智能探索测试的演进之路2025.09.05讲演人 卢皓川毕业于复旦大学。微信终端智能探索自动化测试方向负责人。深耕终端自动化测试多年,以前瞻性视野推动自动化测试体系的智能化演进。从 0 到 1 研发全自动、多平台、高效率、高智能的通用探索型测试能力,已深度赋能微信、QQ 等亿级用户产品多个核心业务的质量保障。其多项原创性、创新性技术成果发表于ICSE、FSE等软件工程领域国际顶会及期刊,在工业界与学术界均产生重要影响。Conference Speaker引言:GUI Testing测试领域“皇冠上的明珠”代码正确 体验正确。GUI 是用户
2、与产品的唯一“触点”,体验好坏直接影响留存与口碑APP质量保障的核心环节需求与页面高频变化,人工执行和用例维护跟不动,定位不稳与界面改动导致频繁失败,用于调试的时间往往超过验证和洞察的时间。人力有限,脚本脆弱只有端到端可信可验证,才敢快迭代。GUI 层是许多故障的暴露点,如集成、配置等问题。一个小的修改点可能引发大面积GUI故障。人人不同的的执行路径,千机千面的运行环境,需要测试的状态组合呈指数增长,脚本难以穷举,真实问题常出现在“没走过的路”上。环境多变,状态爆炸决定研发效率的信任基石重要困难起源与背景:国民级超级应用的测试困境微信的复杂生态聊天/群聊、朋友圈、微信支付、公众号/订阅号、视频
3、号/直播、搜一搜/问一问、小程序/小游戏场景覆盖不足不同业务场景的测试用例差异巨大,交互复杂,难以覆盖用户真实场景中的长尾行为,如特定操作组合或边缘路径引发的异常。迭代高频适配困难各业务独立高频迭代,容易“牵一发动全身”引发故障,业务操作内容各异,需重复修改脚本,无法动态适应新功能或界面变化。业务框架终端原生页面WebView/H5 小程序/小游戏(WXML/Canvas)安卓、iOS、Harmony,PC平台应用质量监管小程序/小游戏平台承接海量应用上传发布,需要质量监管机制,但远无法逐一为各个应用适配测试起源与背景:执行范式变革,重塑测试边界脚本测试智能探索测试自主屏幕理解自主操作决策理解
4、屏幕上 GUI 的可操作区域理解GUI 当前的操作意图范式演进:从外界脚本驱动到工具自主驱动覆盖广探索深时间长零维护发散式业务操作组合深入长尾路径可 7x24 不间断运行自适应迭代无人值守决策更丰富的操作触达更多的业务场景执行符合界面意图的关键动作起源与背景:技术演进路线2.0策略驱动引入了基于路径回溯和强化学习的策略驱动的状态模型探索,显著提升了测试覆盖率。让测试工具“走得更远”1.0控件驱动智能探索测试的起点,让测试工具自主的“看见”并“操作”任意样式的UI界面。3.0业务驱动让机器“看懂”测试,“理解”业务,引入性质测试机制,通过场景识别和业务知识和让测试聚焦业务的核心流程4.0语意驱动
5、大语言模型时代新的机遇,引入多模态大模型,让AI真正像人一样理解界面的内容和语意,实现测试意图的自主理解和生成。始于所见达于所思1.0 时代:控件驱动的智能探索怎样看见?引入模型算法让智能探索自主挖掘屏幕上的可操作区域基于控件树+机器学习的场景理解RootWindowLinearLayoutButtonresource-idtextclickableclassnameViewresource-idtextclickableclassname基础属性复合属性机器学习特征工程1.0 时代:控件驱动的智能探索扑克按钮球杆人物房子锤子建筑基于视觉技术的场景理解兼顾效率与效果:视觉深度模型+传统 CV
6、算法融合兼顾人效与事效:模型自主标注迭代的工作循环2.0 时代:策略驱动的智能探索怎样探索更广?引入探索策略让智能探索深入到更丰富的场景中去基于场景地图的路径回溯2.0 时代:策略驱动的智能探索区分跳转差异,发现更有价值/探索潜力的控件基于强化学习的价值探索ActionValueclickE1v1clickE2v2 APP场景数据操作事件终端驱动APP新一轮场景数据Q-Table 2UpdateRewardSiameseNetworkQ-Table 2ActionValueclickE1v1clickE2v2 Q-LearningMulti-Armed BanditActions123Arms