当前位置:首页 > 报告详情

李赫-蚂蚁数科Agent质量保障体系建设和探索.pdf

上传人: p****n 编号:614094 2025-02-19 34页 5.44MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了蚂蚁数科AI Agent的质量保障体系建设。首先,介绍了Agent的定义和应用场景,以及面临的挑战,如缺乏成熟理论支撑、统一评估标准和丰富场景化测试样本等。其次,阐述了传统质量保障与AI质量保障的差异,提出了面向AI质量保障的转型所需具备的能力。然后,详细介绍了Agent效果评测流程、评测数据构造方式以及Ragas评测指标体系。此外,还讨论了Agent性能评测方案和一站式质量平台建设实践。最后,展望了未来场景化评测方法的探索、Agent一站式评测平台建设和场景化评测数据的生成等方向。
如何打造高效评测体系?" 挑战与未来展望有哪些?" 如何提升Agent质量与效能?"
客服
商务合作
小程序
服务号
折叠