1、Perplexity Comet 电商购物能力测试报告2025.08.12郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录09测试4:给定预算购物(风衣)02关于作者10测试5:指定条件家电购买(冰箱)03测试感受11结尾04测试结果12附件05能力梯度表1306测试1:亚马逊商品购买及复购1407测试2:查找最快发货(自行车)1508测试3:买系列杂物(聚会用物品)162025/8/12目录目录|作者|测试感受|测试结果一览|梯度表|亚马逊复购|选自行车|购买杂物|选购风衣|选购冰箱|附件前言测试任务测试任务3aiwatch.ai 2025/8/12关于作者作者
2、郎瀚威及团队,郎瀚威现居美国硅谷Palo Alto,GPTDAO分析师,第二作者猫猫头,也在硅谷,小红书:107279551更多数据内容请关注公众号:郎瀚威Will,新闻资讯请关注推特:financeyf5 获取更多信息官网飞书:https:/aiwatch.ai/;GenAI网页数据2025Q1报告:链接到飞书查看更多Agent测试报告:链接,含综合能力测试及多个垂类场景能力测试(如写报告、数据抓取、视频总结等)加数据报告群:下方企业微信扫码,备注加Will的数据报告分享群,请简单自我介绍,仅用于讨论行业数据,发广告会飞机。商务合作洽谈,请加微信lang2057,请备注公司信息,因为作者微信
3、已经满了服务包括:1对1推特增长咨询服务等。数据库服务,包含对于市场上产品的详细跟踪和打标,了解商机先人一步。咨询服务包含专业团队对于公开数据的收集,调研,增长分析等,4000美元/月。推特增长顾问服务,分析欧美竞对,构建推特增长路径。价格同上。Will小助手企业微信进不去群扫这个微信公众号数据报告群2目录|作者|测试感受|测试结果一览|梯度表|亚马逊复购|选自行车|购买杂物|选购风衣|选购冰箱|附件4aiwatch.ai 2025/8/12测试Prompt执行结果表格结果结果结果结果1亚马逊商品购买及复购失败成功失败成功2查找最快发货(自行车)部分成功成功成功成功3买系列杂物(聚会用物品)成
4、功成功部分成功成功4给定预算购物(风衣)成功成功成功成功5指定条件家电购买(冰箱)部分成功部分成功部分成功成功平均时间正确/错误比例4/15/04/15/0Prompt时间时间时间时间时间单位:秒OAI AgentPerp CometManusGenspark 3,600 169 480578 83 360 120612 720 20 24086 660 250 3601,028 900 792 840300 1,193 318 408 521 目录|作者|测试感受|测试结果一览|梯度表|亚马逊复购|选自行车|购买杂物|选购风衣|选购冰箱|附件5aiwatch.ai 2025/8/12电商购物
5、十级能力梯度表等级能力节点关键表现成功标准OpenAIAgentPerp CometManusGenspark1级意图解析理解购物需求,提取关键信息能准确识别产品类型、场景、特殊要求2级搜索执行在目标平台进行产品搜索能访问正确网站并执行搜索操作3级结果获取获取并展示搜索结果能返回相关产品列表和基本信息4级智能筛选根据需求过滤不符合条件的选项能排除不匹配的尺码、颜色、型号等5级精准匹配找到完全符合要求的具体商品能定位到用户指定的确切产品6级方案整合提供完整的购买方案能给出清单式的完整解决方案7级实时交互能与电商平台进行实时操作能点击、浏览、查看详情页面8级购物车操作将商品加入购物车并管理能添加商
6、品、修改数量、删除项目9级订单预处理完成地址、配送、优惠等设置能填写收货信息,选择配送方式10级支付完成执行最终的支付操作能使用支付方式完成交易大概率能完成目录|作者|测试感受|测试结果一览|梯度表|亚马逊复购|选自行车|购买杂物|选购风衣|选购冰箱|附件6aiwatch.ai 2025/8/12测试感受by Will团队成员1 dyr主要测了OpenAI Agent、Manus以及Genspark在2个Prompt的表现。1.Manus:只能给出选购清单报告,没有后续的帮我选购,加购物车等更深入的操作。2.OpenAI Agent:OpenAI Agent现在能进入亚马逊但无法进行后续的操作