《郎瀚威will:2025年OpenAI Agent测试报告(49页).pdf》由会员分享,可在线阅读,更多相关《郎瀚威will:2025年OpenAI Agent测试报告(49页).pdf(49页珍藏版)》请在三个皮匠报告上搜索。
1、OpenAI Agent测试报告2025.07.18郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录11Whole Foods订购02关于作者12YouTube视频用例总结03测试感受13视频prompt提取04界面说明14OpenAI Twitter分析05难度分级说明15智能眼镜行业分析06OpenAI任务难度评级表16YouTube找宣传博主07旧金山财务报告查找17Dify AI投资报告+PPT08旧金山寿司餐厅预订18稳定币全面分析09网球锦标赛旅行规划1910新加坡办公室开设研究+PPT202025/7/18目录OpenAI任务群友任务目录|作者|测试
2、感受|难度分级说明|OpenAI任务测试|群友任务测试3aiwatch.ai 2025/7/18关于作者感谢孔一一,李福祥,张倩,张有鱼提供的Prompt。我们从30个群友提供的prompt中随机抽了4个。作者郎瀚威及团队,郎瀚威现居美国硅谷Palo Alto,GPTDAO分析师,第二作者猫猫头,也在硅谷,小红书:107279551更多数据内容请关注公众号:郎瀚威Will,新闻资讯请关注推特:financeyf5 获取更多信息官网飞书:https:/aiwatch.ai/;GenAI网页数据2025Q1报告:链接加数据报告群:下方企业微信扫码,备注加Will的数据报告分享群,请简单自我介绍,仅
3、用于讨论行业数据,发广告会飞机。商务合作洽谈,请加微信lang2057,请备注公司信息,因为作者微信已经满了服务包括:1对1推特增长咨询服务等。数据库服务,包含对于市场上产品的详细跟踪和打标,了解商机先人一步。咨询服务包含专业团队对于公开数据的收集,调研,增长分析等,4000美元/月。推特增长顾问服务,分析欧美竞对,构建推特增长路径。价格同上。Will小助手企业微信进不去群扫这个微信公众号数据报告群21群满了可以加目录|作者|测试感受|难度分级说明|OpenAI任务测试|群友任务测试4aiwatch.ai 2025/7/18测试结果时间单位:秒来源Prompt综合难度时间结果时间结果时间结果时
4、间结果时间结果旧金山财务报告查找2300成功44部分成功480成功60部分成功220成功旧金山寿司餐厅预订3.5511部分成功34部分成功480部分成功120部分成功失败网球锦标赛旅行规划4729成功55成功300成功180成功501成功新加坡办公室开设研究+PPT4.31440成功30成功1500成功480成功742成功Whole Foods订购1.230部分成功14失败1260部分成功180部分成功失败YouTube视频用例总结2.5120成功16成功失败40成功成功视频prompt提取2.7600失败12成功部分成功32成功失败OpenAI Twitter分析2.8600部分成功132部
5、分成功部分成功143部分成功部分成功智能眼镜行业分析3960成功46成功540成功300成功840部分成功YouTube找宣传博主3.5240部分成功85成功成功88成功部分成功Dify AI投资报告+PPT51740部分失败17失败1200部分失败2640成功1260成功稳定币全面分析5720成功失败1380成功840成功1200成功666 10成功44 9成功893 10成功425 12成功794 9成功600 2失败34 3失败870 2失败162 -791 3失败ManusGensparkFellou中位数OpenAIComet官方平均时间群友目录|作者|测试感受|难度分级说明|Ope
6、nAI任务测试|群友任务测试5aiwatch.ai 2025/7/18报告一些Takeaway-by郎瀚威6月我预测,Browerser和通用Agent,必有一战,但我还是没想到,Agent大战到来比想象的还要早的多!从2023年Agent概念兴起,沉寂了一年多,到2024年末ComputerUse,2025年Claude模型能力的持续提高,再到产品的井喷涌现,Perplexity,OpenAI纷纷下场,新赛道的出现已经成为必然。究竟鹿死谁手?乾坤未定,你我皆是黑马。总体来看,目前Agent已经能做到很多事情!敲下这段文字,已经是硅谷的凌晨7点,我还是很兴奋,从2014年进入互联网行业,听了很