当前位置:首页 > 报告详情

郎瀚威will:2025年OpenAI Agent数据抓取能力测试报告(51页).pdf

上传人: 山海 编号:734432 2025-08-04 51页 4.68MB

下载:

1、OpenAI Agent 数据抓取能力测试报告2025.08.01郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录10LinkedIn UX设计师招聘02关于作者11结尾03测试感受12附件04测试结果1305旧金山政府预算数据分析1406Epic公司潜在客户开发1507100款运动鞋对比矩阵1608医疗健康创业公司融资分析1709YouTube Genspark视频分析182025/8/1目录目录|作者|测试感受|旧金山数据查找|客户开发|运动鞋对比|医疗创业公司|Genspark视频分析|设计师招聘3aiwatch.ai 2025/8/1关于作者作者郎瀚威及团

2、队,郎瀚威现居美国硅谷Palo Alto,GPTDAO分析师,第二作者猫猫头,也在硅谷,小红书:107279551更多数据内容请关注公众号:郎瀚威Will,新闻资讯请关注推特:financeyf5 获取更多信息官网飞书:https:/aiwatch.ai/;GenAI网页数据2025Q1报告:链接加数据报告群:下方企业微信扫码,备注加Will的数据报告分享群,请简单自我介绍,仅用于讨论行业数据,发广告会飞机。商务合作洽谈,请加微信lang2057,请备注公司信息,因为作者微信已经满了服务包括:1对1推特增长咨询服务等。数据库服务,包含对于市场上产品的详细跟踪和打标,了解商机先人一步。咨询服务包

3、含专业团队对于公开数据的收集,调研,增长分析等,4000美元/月。推特增长顾问服务,分析欧美竞对,构建推特增长路径。价格同上。Will小助手企业微信进不去群扫这个微信公众号数据报告群21群满了可以加目录|作者|测试感受|旧金山数据查找|客户开发|运动鞋对比|医疗创业公司|Genspark视频分析|设计师招聘4aiwatch.ai 2025/8/1测试Prompt执行结果表格目录|作者|测试感受|旧金山数据查找|客户开发|运动鞋对比|医疗创业公司|Genspark视频分析|设计师招聘序号Prompt简述来源一句话总结1旧金山政府预算数据分析OpenAI五年预算数据表格2Epic公司潜在客户开发G

4、enspark提供特定条件的潜在客户3100款运动鞋对比矩阵Manus比较100款运动鞋4医疗健康创业公司融资分析Genspark列出特定条件的公司5YouTube Genspark视频分析Genspark查找 20 个Genspark视频6LinkedIn UX设计师招聘Genspark寻找特定条件的设计师100ManusProGenspark4107OpenAIAgent58200202020123301091005aiwatch.ai 2025/8/1报告一些Takeaway-by郎瀚威Manus在今天launch了自己的Pro plan,主要prompt场景为数据抓取和图片设计。正好我

5、们之前没测过数据抓取。与是就启动了这次任务。为什么是测试数据抓取?因为根据我个人经验,公司员工用这个功能做市场调研,其刚需程度大于图片抓取。比如销售找线索leads,比如调研竞品公司等等。大家可以仔细看看原Prompt,条件其实还挺苛刻的。市场进化非常快,大家功能上你追我赶,技术路线,效果上也是如此。今天的效果不代表明天的效果。另外测试员工评价的,仅代表其个人观点和感受,大家看看一乐得了。幕后花絮:这次任务一波三折。我们看到Manus发布新功能,就计划开始测试,从硅谷时间下午就开始了。把所有任务跑出来,文件下载等等,一开始,和上次分析PPT一样,用大模型评测结果。结果比较奇怪。一开始不同人测试

6、分数不同,后来发现同一个人测试分数也不同。这时候已经硅谷半夜1点了。我们紧急开会讨论。最后回归到只计算数量,不评价的这个状态。中间还多人反复跑了下几个任务。由于时间仓促,没有精调测试评价Prompt,可以说是被自己的不小心和LLM幻觉小坑了一回。不过最后好歹算是在硅谷时间早上5点收尾力挽狂澜。因此本次测试的定位,就是给大家当一下基础设施,帮大家跑一下任务,做一回远程公共牛马。本次6个任务,Manus花了约2300点数,平均每个任务300-500左右。Prompt看板开源(到Notion:链接)6aiwatch.ai 2025/8/1测试感受by 猫猫头Manus在今天launch了自己的Pro

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,本文主要概括了以下关键点: 1. 测试了Manus、Genspark和OpenAI Agent在数据抓取任务中的表现,包括旧金山政府预算数据分析、Epic公司潜在客户开发、100款运动鞋对比矩阵、医疗健康创业公司融资分析、YouTube Genspark视频分析和LinkedIn UX设计师招聘等6个任务。 2. 测试结果显示,Genspark在数据抓取任务中表现最佳,Manus次之,OpenAI Agent表现较差。Genspark在多数任务中成功生成可下载的表格,Manus也表现良好,但喜欢生成报告。OpenAI Agent则很少生成可下载的表格。 3. 测试中,Manus和Genspark的访问量在4-6月呈现明显增长,功能更新频繁,推测有老用户留存。Manus在3-6月的访问量在1500万~2000万左右,Genspark在4-6月的访问量在800万左右。 4. 文章最后提供了Manus和Genspark的产品更新时间线,以及Comet的流量分析数据。
数据抓取哪家强? AI招聘效果如何? YouTube视频分析哪家强?
客服
商务合作
小程序
服务号
折叠