1、Genspark AI Developer测试报告2025.08.15郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录09测试4:创建网站(美容养护)02关于作者10测试5:创建网站(个人简历)03测试感受11测试6:创建网站(AI监控情报站)04测试结果12测试7:创建网站(追番情报站)05能力梯度表13结尾06测试1:生成游戏(超级马里奥)14附件07测试2:创建网站(家庭家务打卡器)1508测试3:创建网站(宠物用品)162025/8/15目录目录|作者|测试感受|测试结果一览|马里奥游戏|家务打卡|宠物用品|美容养护|个人简历|AI情报站|追番情报站前言测
2、试任务测试任务3aiwatch.ai 2025/8/15关于作者作者郎瀚威及团队,郎瀚威现居美国硅谷Palo Alto,GPTDAO分析师,第二作者猫猫头,也在硅谷,小红书:107279551更多数据内容请关注公众号:郎瀚威Will,新闻资讯请关注推特:financeyf5 获取更多信息官网飞书:https:/aiwatch.ai/;GenAI网页数据2025Q1报告:链接到飞书查看更多Agent测试报告:链接,含综合能力测试及多个垂类场景能力测试(如写报告、数据抓取、视频总结等)加数据报告群:下方企业微信扫码,备注加Will的数据报告分享群,请简单自我介绍,仅用于讨论行业数据,发广告会飞机。
3、商务合作洽谈,请加微信lang2057,请备注公司信息,因为作者微信已经满了服务包括:1对1推特增长咨询服务等。数据库服务,包含对于市场上产品的详细跟踪和打标,了解商机先人一步。咨询服务包含专业团队对于公开数据的收集,调研,增长分析等,4000美元/月。推特增长顾问服务,分析欧美竞对,构建推特增长路径。价格同上。Will小助手企业微信进不去群扫这个微信公众号数据报告群2目录|作者|测试感受|测试结果一览|马里奥游戏|家务打卡|宠物用品|美容养护|个人简历|AI情报站|追番情报站4aiwatch.ai 2025/8/15测试Prompt执行结果表格1生成游戏(超级马里奥)2创建网站(家庭家务打卡
4、器)3创建网站(宠物用品)4创建网站(美容养护)5创建网站(个人简历)6创建网站(AI监控情报站)7创建网站(追番情报站)成功/失败比例7/07/07/0结果结果结果结果 成功 失败 部分成功 部分成功 部分成功 成功 成功Lovable 成功 成功 部分成功 成功 成功 成功 成功 成功 成功 成功 失败 成功 成功 成功 成功 成功 成功结果 部分成功 成功 成功 成功 成功7/03/4 成功 成功 失败 成功 部分成功 失败时间单位:秒OAI AgentPerp CometManusGensparkPrompt目录|作者|测试感受|测试结果一览|马里奥游戏|家务打卡|宠物用品|美容养护|
5、个人简历|AI情报站|追番情报站注:本次时间较为仓促,因此并未列出时间。本页结果评价也较为简单,建议从业人员可以看看每一个的体验评价,以及生成的结果链接。进行自行判断。5aiwatch.ai 2025/8/15测试感受by 郎瀚威 Will主要看了一遍结果看完了感受,这几家agent,由于对于用户需求收集反馈不同,技术选型不同,选择了不同的方向和体验。Openai的功能体验,感觉在整合很多细节很粗糙,优化的不好。Comet,我个人在推特和微信生态里,逐步感受到用户对其好评,其浏览器在许多场景有优势,但是这一次在体验中并没有占到优势。大部分结果需要手动复制黏贴代码,优化的不好。剩下三家优化的都不
6、错。各有千秋。具体来说,我把测试员的结果放到Claude里,循环评价了一下。大概是如下图的结论。还是我之前的观点,程序员人群占全部PC使用人群的一小部分,普通办公用户最终感受到的,无论是否套壳,就是看场景,优化和细节体验。还是持续看好通用Agent这个赛道!上接Claude,下吞噬各类垂类GenAI 1.0应用。目录|作者|测试感受|测试结果一览|马里奥游戏|家务打卡|宠物用品|美容养护|个人简历|AI情报站|追番情报站6aiwatch.ai 2025/8/15测试感受by Will团队成员1 zwt主要测了OpenAI Agent、Comet、Manus、Genspark以及Lovable在