《2023ChatGPT插件发展现状及使用体验案例报告.pdf》由会员分享,可在线阅读,更多相关《2023ChatGPT插件发展现状及使用体验案例报告.pdf(33页珍藏版)》请在三个皮匠报告上搜索。
1、2 0 2 3 年深度行业分析研究报告请务必阅读正文之后的免责声明及其项下所有内容快速繁荣但仍有短板的插件生态0101插件与ChatGPT互相赋能,更适合标准化场景0202插件使用体验案例0303目录目录 低门槛的插件开发过程带动插件数量快速增长 插件发布并未带动ChatGPT流量 OpenAI也在推动其他B端策略:API调用、模型商店 插件更适合标准化场景、信息处理类任务 ChatGPT与插件互相赋能,但交互流程与各自性能仍有不足 如何提升插件的体验:优化商店设计、训练模型更好地调用插件风险提示0404VX8ZlViXiYbYAZfWiXaQdN7NsQpPoMsRlOoOsNfQnMmOb
2、RrRxOuOmQyQxNmQsR请务必阅读正文之后的免责声明及其项下所有内容ChatGPT ChatGPT 插件插件(Plugins Plugins)发展大事件)发展大事件 外界给予厚望的插件应用外界给予厚望的插件应用:自从OpenAI 在 23 年 3 月 23 日发布了 ChatGPT plugins以来,外界对它在 OpenAI 生态打造、商业层面的潜力充满期待。中英文社区一度认为这是 OpenAI 的“App Store 时刻”。策略克制的策略克制的OpenAIOpenAI:发布插件应用的前两个月,OpenAI 并未大肆宣扬推广,仅有一次TED演示说明了插件的实力。5 月,OpenA
3、I 宣布向 Plus 订阅用户全量开放,不过开放的策略十分克制。在大规模放量之后,ChatGPT 面临的现实是 Plugin 仍然是一个相当早期的生态。3月月23日日插件诞生插件诞生4月月21日日插件演示插件演示5月月13日日插件有限制开放插件有限制开放4月期间月期间大量插件接入大量插件接入OpenAI宣布推出ChatGPT plugins,是之前开放API的一次升级。可以标准化的使用其他网站、APP的API接口,让ChatGPT获取到对方的能力和对应的数据,完成被允许的操作。OpenAI联合创始人Greg Brockman在2023TED上演示未发布的ChatGPT插件,并展示了ChatGP
4、T的新能力,即使给出相对模糊的指示,也能对工作进行事实核查,并解释数据密集型电子表格。4 月除了官方合作伙伴外,大量的第三方 plugin 被开发,用户则疯狂涌向 waitlist 并且在 Twitter 上成为 Code Interpreter 等明星 plugin 的自来水。OpenAI 宣布向 Plus 订阅用户全量开放第三方 plugins。不过开放的策略十分克制,只针对只针对Plus 用户,同时必须打用户,同时必须打开开 Beta features 的开关的开关,iOS app 也默认不显示也默认不显示 Plugin。资料来源:Open AI官网,TED 大会,Foresight N
5、ews,国信证券经济研究所整理图:图:ChatGPT ChatGPT 插件发展插件发展历程历程请务必阅读正文之后的免责声明及其项下所有内容OpenAIOpenAI插件增长迅速,目前包括办公、本地服务等八大类插件增长迅速,目前包括办公、本地服务等八大类数量:数量:ChatGPTChatGPT的的插件数量增长迅速,发布初期仅插件数量增长迅速,发布初期仅1111个,个,5月13日刚开放时为74个,6月18日已经从11个增长至461个。自从5月13日插件功能开放给Plus用户以来,插件的数量增长也变快,平均每日增加11个。但数量的增长非线性,其中112个为6月11日一天内新增。功能类型:功能类型:对于
6、ChatGPT的插件类型进行区分,按照功能划分主要包括办公、本地服务、商务、娱乐、金融、教育、出行、主要包括办公、本地服务、商务、娱乐、金融、教育、出行、购物等八类购物等八类。这些插件皆由第三方插件供应商提供,其中既有大型平台,也有小微创企。在所有的插件类型中以办公类、本地服务、娱乐类、商务类插件为主。11711302403884304610501001502002503003504004505003月24日3月31日4月7日4月14日4月21日4月28日5月5日5月12日5月19日5月26日6月2日6月9日6月16日图:插件数量增长折线图:插件数量增长折线本地服务17%商务12%娱乐11%金
7、融10%教育8%出行6%购物5%其他1%图:图:插件类型分布插件类型分布办公30%资料来源:ChatGPT Plugin Store,国信证券经济研究所整理资料来源:ChatGPT Plugin Store,国信证券经济研究所整理30%请务必阅读正文之后的免责声明及其项下所有内容插件的快速增长:低开发门槛与高灵活性插件的快速增长:低开发门槛与高灵活性 插件的快速增长的核心原因是创建插件的快速增长的核心原因是创建ChatGPT PluginsChatGPT Plugins流程非常简单流程非常简单。开发者仅需要制作API、制定API接口文件、制定符合OpenAI的格式规范的清单文件(说明插件和GP
8、T的信息交互),即可调试运行。ChatGPT无需进行预训练或者fine-tuning,也不需要做适配工作。成功开发案例也带来了更多的效仿者,预计Plugins数量未来还将进一步扩张。但是,插件数量仍会受到两方面限制:但是,插件数量仍会受到两方面限制:1)由于OpenAI需要对插件进行安全性审查,插件需要时间陆续上架;2)部分客户对插件功能的效果、影响和安全性仍存在顾虑。图:图:OpenAIOpenAI创建插件步骤创建插件步骤资料来源:OpenAI官网,国信证券经济研究所整理图:图:OpenAIOpenAI插件插件PolicyPolicy资料来源:OpenAI官网,国信证券经济研究所整理请务必阅
9、读正文之后的免责声明及其项下所有内容ChatGPT ChatGPT PluginsPlugins的评价的评价B端评价端评价C端评价端评价腾讯云开发者社区腾讯云开发者社区:插件实现的功能还比较有限功能还比较有限。各个插件仅能提供一些基础功能,很难满足较高定制化很难满足较高定制化的需求。CSDN博客博客:一部分调用插件的加载速度较慢加载速度较慢,需要等待比较长的时间,容易影响到用户体验。用户可能不能快速准确地找到合适不能快速准确地找到合适的插件的插件,且部分插件不能共同使用不能共同使用(如Expedia和KAYAK)。知乎用户知乎用户(捡到一束光):同时插件模型只能同时支持3个插件,针对不同的问题
10、还需要开启新对话更换插件针对不同的问题还需要开启新对话更换插件,限制多;用户稀土掘金:用户稀土掘金:插件网站链接的跳转增加了信息量增加了信息量同时也为原软为原软件合理导流件合理导流。Arslan Mirza:作为一名人工智能爱好者,插件的概念很吸引人,大模型里面充满各领域有趣的链接;用户用户1件功能需要在某种情况下才可用。CSDN博客博客:除了简单的回答问题之外,还能够基于答案帮用户基于答案帮用户做有效信息延伸和建议做有效信息延伸和建议。Instacart:插件“Ask Instacart”功能推出,Instacart 将彻底改变消费者使用在线购物平台互动和导航的方式。通过集成ChatGPT,
11、Instacart更能为客户提供更加个性化、更加个性化、更具吸引力更具吸引力的杂货购物体验购物体验,更加自然化和人性化。Airbnb:首席执行官 Brian Chesky在讨论第一季度业绩时表示,他认为ChatGPT底部带有小部件的纯科技空间界面可能不适合旅行界面不适合旅行界面,他认为适合旅行的界面是多模旅行的界面是多模式的式的,它应该是多媒体,是照片,是视频,更加身临其境。Kayak:首席科学家 Matthias Keller 称 ChatGPT为下一个大型应用商店。ChatGPT 插件也许可以提供完美的流量导入和产品测试途径:ChatGPT通过上下文交互了解用户需求,给用户更有针对性和个性
12、化的推荐服务,为插件带来了精准流量;帮助用户跨渠道体验产品,打通大模型到应用的链路;插件让用户容易体验到第三方产品,建立品牌认知;腾讯云开发者社区腾讯云开发者社区:插件实现的功能还比较有限功能还比较有限。各个插件仅能提供一些基础功能,很难满足较高定制化很难满足较高定制化的需求。Arslan Mirza:作为一名人工智能爱好者,插件的概念很吸引人,大模型里面充满各领域有趣的链接。用户稀土掘金:用户稀土掘金:插件网站链接的跳转增加了信息量增加了信息量同时也为原软件合理导流为原软件合理导流。知乎用户知乎用户(捡到一束光):同时插件模型只能同时支持3个插件,针对不同的问题还需要开启新对话更换插件针对不
13、同的问题还需要开启新对话更换插件,限制多。CSDN博客博客:一部分调用插件的加载速度较慢加载速度较慢,需要等待比较长的时间,容易影响到用户体验。用户可能不能快速准不能快速准确地找到合适的插件确地找到合适的插件,且部分插件不能共同使用不能共同使用(如Expedia和KAYAK)。正面正面正面正面负面负面负面负面负面负面负面负面正面正面正面正面资料来源:Twitter,Forbes,CSDN,腾讯云开发社区,国信证券经济研究所整理对于ChatGPT插件功能,B端商家评价偏向于正面,但C端评价好坏参半,插件的用户体验仍有改善空间。请务必阅读正文之后的免责声明及其项下所有内容OpenAIOpenAI流
14、量变化:流量变化:PluginsPlugins发布尚未带动发布尚未带动ChatGPTChatGPT流量向上流量向上 宣布推出PluginsPlugins开放使用发布GPT4资料来源:Similarweb,国信证券经济研究所整理图:图:2月至今月至今AI应用网站周访问量变化(百万)应用网站周访问量变化(百万)请务必阅读正文之后的免责声明及其项下所有内容OpenAIOpenAI的发展策略:推动的发展策略:推动GPTGPT系列大模型的普惠系列大模型的普惠20232023年年OpenAIOpenAI的首要任务:的首要任务:更便宜、更快的更便宜、更快的GPT-4GPT-4,这是Sam分享的近期路线,后续
15、OpenAI将继续推动:降本降本:OpenAI的目标是尽可能降低“智能的成本”,包括 API的成本。高记忆性:高记忆性:更长的上下文窗口,将来高达一百万 tokens 的上下文窗口是可能的。可微调(可微调(Fine-TuningFine-Tuning)的模型:)的模型:可以微调模型、API,由开发者塑造他们真正想要的东西。记录历史数据记录历史数据:目前的对话需要反复传递同样的信息,未来将有可以记住历史对话的版本。多模态多模态:GPT4的发布时已经展示了多模态功能,2024年OpenAI的多模态版本可能会上线。3月月23日日鼓励插件鼓励插件5月月29日日AI内嵌而不是插件内嵌而不是插件6月月21
16、日日模型商店模型商店6月月13日日降价推降价推API接入接入Sam Altman在推特上宣布推出 ChatGPT 插件。鼓励用户可以安装插件来帮助完成各种任务,并表示很高兴看到开发人员创造出什么。Sam Altman在伦敦与AI 公司 HumanLooop 的 CEO 闭门讨论中表示未来的应用应用趋势是大模型的功能嵌入更趋势是大模型的功能嵌入更多多 APPs,而不是在 ChatGPT 上生长出更多插件,因为现实中大多数插件并没有呈现出 PMF(Product/Market Fit,即产品市场匹配)。OpenAI宣布发布新版本的GPT-3.5-turbo和GPT-4,用户最多的嵌入模型 Text
17、-embedding-ada-002降价75%;用户最多的聊天模型gpt-3.5-turbo降价25%。Sam Altman表示OpenAI 每三个月左右就能将推理成本降低90%。OpenAI 计划推出一个市场,允许开发者出售基于其自己的人工智能技术构建的人工智能模型,类似 App Store。企业可以基于OpenAI相关技术搭建的产品,根据自己需求定制的 AI 模型卖给其他公司。资料来源:Twitter,HumanLooop官网(后续撤下),The information,国信证券经济研究所整理图:图:OpenAIOpenAI的发展策略的发展策略请务必阅读正文之后的免责声明及其项下所有内容G
18、PTGPT系列模型赋能下游应用,带动系列模型赋能下游应用,带动B B端的强烈需求端的强烈需求随着ChatGPT的火爆以及背后GPT系列模型的更新迭代,AI赋能的概念已经深入人心。新技术能高效快速解决特定问题:新技术能高效快速解决特定问题:在自然语言对话、自然语言理解、对有关信息的查询加工处理;新技术带来新的产品市场:新技术带来新的产品市场:为早期采用者创造了的机会,比如最近新增的Chat类应用。过往成功案例:iphone推出后开始移动互联网时代;利用利用 GPT GPT模型更新产品可以作为公关和营销资产:模型更新产品可以作为公关和营销资产:提升品牌科技属性,重塑客户与产品的互动体验;低投入:低
19、投入:无论是API调用还是插件,对于第三方接入工程量难度低,使用的Token费用也越来越低;资料来源:Tooploox,新周刊,国信证券经济研究所整理资料来源:点点数据,国信证券经济研究所整理图:图:iphoneiphone与与其丰富的应用其丰富的应用商店商店图:图:AIAI应用调用应用调用GPTGPT模型并作为模型并作为产品宣传产品宣传点点请务必阅读正文之后的免责声明及其项下所有内容ChatGPT PluginsAPI调用调用模型商店模型商店技术特征技术特征ChatGPT通过API接口调用和使用第三方程序应用通过API接口获得GPT模型能力类似 App Store 的大模型市场,为企业提供各
20、种前沿的 LLM,允许fine-tuning和发布自己的模型主要优点主要优点ChatGPT获得第三方插件的部分功能接入插件的第三方应用可以获得流量OpenAI按照调用的算力收费第三方应用获得GPT模型的能力第三方应用获得更加定制化的更加定制化的AI功功能能主要缺点主要缺点使用体验受限于结果准确性、场景适用性、体验受限于结果准确性、场景适用性、效率等因素;效率等因素;API接口能提供的AI能力较单一能力较单一,局限在简单自然语言处理任务范围内需要企业具备一定的需要企业具备一定的AI工程化能力工程化能力来进行大模型的调优竞争对手竞争对手谷歌、HuggingFace、Meta等大模型公司谷歌、Hug
21、gingFace、Meta等大模型公司微软、亚马逊、谷歌等模型平台公司盈利模式盈利模式插件功能面向Plus用户开放;后续可能收取第三方插件坐席费;按照调用模型计算的Token量计费;预计按照在平台上使用的模型收取佣金费用,具体收费形式暂不清楚;现状或相似实现状或相似实例类比例类比类比类比Google Chrome:浏览器插件数量庞大,但存在感低、功能重复性高,头部和尾部插件的流量差距悬殊。安全公司 Extension Monitor 对 Chrome 应用商店中超过 18 万个扩展应用进行了跟踪监测,有近 87%的插件安装量都低于 1000 次,更有约一半的插件安装量都低于 16 次。另外,下
22、载量为 0 的插件也有不少,数量为 19379 个,占总量约 10%;还有近 25540 个插件只拥有一个用户。ChatGPT通过插件的形式向其他开发者提供AI能力,许多更新AI应用的公司选择调用OpenAI的API。然而Sam Altman却表示,“这一模式并没有达到他们的预期”。以App Store和Google Play为代表的应用商店经济,在过去十余年间驱动了整个移动互联网行业。如今的移动互联网几乎就是建立在应用商店的基础上。App Store的模式在过去十余年累计创收1.1万亿美元,开发者们创建的种类丰富、数量众多的应用功不可没。OpenAIOpenAI的选择:的选择:ChatGPT
23、 PluginsChatGPT Plugins、APIAPI调用与模型商店模式对比调用与模型商店模式对比资料来源:ChatGPT Plugin Store,OpenAI官网,Extension Monitor,HumanLooop,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容快速繁荣但仍有短板的插件生态0101插件与ChatGPT互相赋能,更适合标准化场景0202插件使用体验案例0303目录目录 低门槛的插件开发过程带动插件数量快速增长 插件发布并未带动ChatGPT流量 OpenAI也在推动其他B端策略:API调用、模型商店 插件更适合标准化场景、信息处理类任务 Cha
24、tGPT与插件互相赋能,但交互流程与各自性能仍有不足 如何提升插件的体验:优化商店设计、训练模型更好地调用插件风险提示0404请务必阅读正文之后的免责声明及其项下所有内容插件工作流程:插件工作流程:ChatGPTChatGPT起到用户与起到用户与PluginsPlugins连接的桥梁作用连接的桥梁作用GPT在插件调用前/后环节起到协调作用,包括将用户的Prompt转化为面向插件API的代码指令(前处理),以及将插件API返回的代码转化为面向用户的自然语言,并以文本形式展现,从而实现对插件调用。输入问题ChatGPT生成调用API的代码并发送请求插件返回相关信息基于插件返回信息,ChatGPT生
25、成回答ChatGPT判断是否要启用插件、启用哪个插件插件流程插件流程优点优点 会将自然语言转化为合适指令可能出现的问题可能出现的问题 将不同插件串联使用,实现更好效果ChatGPT决定是否继续调用其他插件 可能生成的请求错误 可能判断错误,调用了错误的插件 提升ChatGPT技能 提升ChatGPT智力 可能插件本身性能差 可能描述不准确,需要二次确认 不能并行使用插件 会对插件返回信息二次加工 没有有效优化内容或者负优化案例案例 问题案例:如预定机票的任务中,向用户确认是否接受转机;优点案例:如预定机票的任务中补齐人数、成人/儿童的乘客类型;制定减肥饮食计划时,先制作减肥食谱再调用购物插件进
26、行商品选择购买;问题案例:许多插件无法识别中文、无法同时提供信息链接;优点案例如用户输入为中文、插件输出为英文时,ChatGPT会返回为中文;在使用读取PDF、读取视频的插件时,插件返回的往往是链接的全部内容,GPT会对这些内容进行概括总结以保证输出的精简 优点案例:如根据文档绘制思维导图,会先调取读取文件插件、再调取绘图表插件;问题案例:如购物任务,ChatGPT可能同时调用Shop、ShopBest、Instacart;资料来源:ChatGPT,国信证券经济研究所整理图:插件调用流程与图:插件调用流程与各环节优缺点各环节优缺点请务必阅读正文之后的免责声明及其项下所有内容插件使用体验总结插件
27、使用体验总结类别类别特点特点插件插件插件特点插件特点办公办公方便获取信息方便获取信息:可以快速从视频、网页、PDF中提取主要信息以及寻找特定内容和答案;场景适用场景适用:文本处理为ChatGPT的优势领域,办公领域用户指令较明确,易通过简单交互完成。可能输出错误可能输出错误:ChatGPT在接收到不可理解信息或者过长信息后,会出现幻觉、输出错误;不擅长中文信息源不擅长中文信息源:插件性能局限,对英文信息处理正确率高,但中文信息源易处理出错;AskYourPDF可读取PDF并对PDF内容问答,中文阅读偏离严重Show Me创建可编辑的图表,图表结构简单VoxScript可以访问视频、网页各种数据
28、源,可对信息处理总结WebPilot访问提取网页信息,可对信息处理总结Summarize Anything总结视频内容,信息可能出错Video Insights获取视频的内容等信息,信息可能出错Kraftful编写产品文档,与GPT4生成文档质量差别不大Yabble可设计问卷并进行调查,只能对虚拟生成的人物调查Yay!Forms生成调查问卷,需要跳转第三方付费查看本地本地生活与生活与购物购物可以通过自然语言输入满足购物的需求可以通过自然语言输入满足购物的需求,提供对应的商品购买链接;场景适用性差场景适用性差:非标准化场景,比如信息复杂、用户需求模糊的场景,插件调用体验不如直接官网搜索或者应用内
29、嵌ChatGPT;使用区域局限:使用区域局限:多数插件只针对北美区域;不擅长中文信息源不擅长中文信息源:由于插件性能局限,对于英文信息可正确理解,但中文信息不能识别;Instacart可以根据要求给出菜谱和对应原料的链接,无法识别中文Shop可以根据要求找到第三方相关的商品结果Shop Best可以根据要求给出亚马逊平台搜索结果,链接有时失效Klarna Shopping可以根据要求给出Klarna平台搜索结果,展示效果不如直接在Klarna官网搜索资料来源:ChatGPT,国信证券经济研究所整理表:办公、本地生活、购物表:办公、本地生活、购物类插件使用体验总结类插件使用体验总结请务必阅读正文
30、之后的免责声明及其项下所有内容插件使用体验总结插件使用体验总结类别类别特点特点插件插件插件特点插件特点出行出行可以通过自然语言输入提供对应的行程安排可以通过自然语言输入提供对应的行程安排;使用效率低:使用效率低:插件调用体验不如直接官网搜索或者应用内嵌ChatGPT;使用区域局限:使用区域局限:多数插件只针对北美区域;KAYAK可以根据要求给出酒店、航班的预定链接,需要跳转第三方确认支付Expedia可以根据要求给出酒店、航班的预定链接,需要跳转第三方确认支付教育教育信息准确:信息准确:搜索答案准确,链接有效,可以下载全文或者跳转获得完整内容;信息获取优化有限信息获取优化有限:反馈信息有限,搜
31、索流程没有太多优化,检索的信息源都是第三方信息源;与与ChatGPTChatGPT功能重合功能重合:部分插件的功能如语法纠正、语义查询、描述优化与ChatGPT功能重合;Speak(教学(教学类)类)学习语法及语言表达方式,ChatGPT具有同样的功能ScholarAl(搜索(搜索类)类)根据关键词获取论文的全文,论文库为汇总的公开论文数据源edX(搜索类)(搜索类)可以根据要求给出edX课程库的课程Wolfram(工具类)工具类)计算工具,可以解决数学问题、数据可视化、创建图表Prompt Perfect(工具类)(工具类)对用户输入进行优化,ChatGPT具有同样的功能金融金融 增加新的信
32、息获取途径增加新的信息获取途径:可以帮助用户获得投资组合建议,提供实时和历史的金融市场数据;信息准确度低信息准确度低:信息存在一定的错误,需要用户检查甄别。没有提供信息来源的功能,全文链接为ChatGPT捏造;使用区域与语言局限:使用区域与语言局限:股票通常只针对美股,对于英文信息可正确理解,但中文信息不能识别;PortfolioPilot可提供投资组合建议,只针对美国、加拿大地区股票Public提供实时和历史的金融市场数据,但数据不一定准确且无参考来源BizToc 提供商业新闻,但信息不一定准确且无参考来源资料来源:ChatGPT,国信证券经济研究所整理表:出行、教育、金融类插件使用体验总结
33、表:出行、教育、金融类插件使用体验总结请务必阅读正文之后的免责声明及其项下所有内容插件使用体验总结插件使用体验总结类别类别特点特点插件插件插件特点插件特点娱乐娱乐 生成效率高:生成效率高:一次输入可以输出多个设计方案,生成几十页的故事;输出输出要要跳转跳转第三方查看第三方查看 对话次数限制对话次数限制:对话的次数上限25次/3h不能满足游戏交互的需求;交互形式单一、效率慢、操纵复杂交互形式单一、效率慢、操纵复杂:自然语言交互不适合强交互类的游戏,降低了游戏的趣味性;展现形式单一:展现形式单一:以文字或富文本的形式展现,不够形象直观;插件水平较低插件水平较低:插件提供的内容质量一般,带给用户的体
34、验一般;不擅长中文信息源不擅长中文信息源:由于插件性能局限,不能理解或生成中文信息;Bohita帮用户设计服装logo,生成的图案质量一般Stories生成可以有插画的故事,需要跳转第三方阅读,只有英文故事Asset Ovi生成图像素材,素材的质量一般Free Kiddie Books提供免费阅读的儿童图画书,要到第三方查看Polarr图像滤镜,要到第三方使用滤镜Likewise影视等推荐,只能从信息库搜索出答案,详细的信息需要到第三方查看Open Trivia生成趣味问答题,只能从题库搜索出题目Tic Tac Toe下井字棋,文字对话进行游戏,交互形式单一、效率慢Chess下国际象棋,交互形
35、式单一、效率慢Crafty Clues猜线索词,只能英文回答Algorithma虚拟世界RPG游戏,对话的次数上限25次/3h不能满足游戏交互的需求;资料来源:ChatGPT,国信证券经济研究所整理表:表:娱乐类插件使用体验总结娱乐类插件使用体验总结请务必阅读正文之后的免责声明及其项下所有内容插件的适用性对比:插件更适合标准化场景、信息处理插件的适用性对比:插件更适合标准化场景、信息处理简单信息处理标准化需求场景长信息、复杂信息处理任务非标准化需求场景办公办公教育教育出行出行本地生活本地生活购物购物只获取信息不如搜索引擎搜或到插件官网搜索,因ChatGPT可能会出错,甚至返回虚假信息;Chat
36、GPT性能限制了信息处理和展示的长度,信息过长会出错,同时对于图片、音频、视频等信息的展示不够友好用户需求越模糊越难获得有效的答案,非标场景需要较准确、复杂的用户输入来精准执行,否则效率低、易出错。信息复杂、用户需求模糊、需要用户挑选、更适合“应用内嵌ChatGPT”,比如购物、求职;信息聚合任务商品展列任务因为用户界面的设置以及多模态信息的处理问题,ChatGPT更适合信息的聚合处理而非商品的展列,能一次性展示的图片等信息有限;需要信息加工任务信息获取任务场景适用性:场景适用性:适合的场景适合的场景不太适合的场景不太适合的场景原因分析原因分析娱乐娱乐资料来源:ChatGPT,国信证券经济研究
37、所整理图:插件适用与不适用的图:插件适用与不适用的场景场景请务必阅读正文之后的免责声明及其项下所有内容插件功能的优点:插件对于插件功能的优点:插件对于ChatGPTChatGPT的赋能的赋能1.1.插件使得插件使得ChatGPTChatGPT获得了更丰富的功获得了更丰富的功能:特别是联网搜索和多模态能力。能:特别是联网搜索和多模态能力。借助网络搜索插件可以使ChatGPT访问网络和专业数据库的实时信息;借助图片、音频、视频处理插件可以使ChatGPT处理多模态信息;功能的延伸功能的延伸1.1.插件使得插件使得ChatGPTChatGPT的功能覆盖到购物、的功能覆盖到购物、出行等各种线下场景:出
38、行等各种线下场景:服务类插件已经包括酒旅、出行、零售、餐饮订座等类型,预计未来数量会进一步增加。场景的延伸场景的延伸1.1.插件弥补了插件弥补了ChatGPTChatGPT在部分专业领域的在部分专业领域的性能不足:性能不足:包括数理计算和长文本阅读等,Wolfram插件可以提升数字计算能力、借助AskYourPDF和ChatWithPDF可以阅读篇幅很长的PDF文档。性能的延伸性能的延伸图:图:ScholarAI反馈最新论文反馈最新论文图:图:Instacart生成本地购买链接生成本地购买链接图:图:Wolfram完成复杂数学计算完成复杂数学计算资料来源:ChatGPT,国信证券经济研究所整理
39、资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件功能的优点:插件功能的优点:ChatGPTChatGPT对于对于PluginsPlugins的赋能的赋能1.1.插件通用账号体系:插件通用账号体系:目前用户使用插件不需要做界面的切换,大部分插件不需要第三方账户即可使用;而如果在第三方插件官网使用则绝大部分需要先注册登录。便捷性便捷性1.1.流程更智能:流程更智能:用户只需大概了解插件的作用,将自己的任务用自然语言描述输入,ChatGPT可以对任务拆解、提取、调用第三方工具,有时还会通过对话提醒用户补充
40、其他信息或进行其他操作步骤。智能性智能性1.1.组合使用多个插件:组合使用多个插件:ChatGPT可以一次调用多插件,通过对多个工具的组合使用来满足复杂的需求。例如,用户在制定旅行规划时,可以先使用Kayak或Expedia来预定航班或酒店,然后使用Opentable预定餐厅,并且多项任务可以在一次对话完成。组合性组合性图:图:Instacart官网登录界面官网登录界面图:图:ChatGPT提示用户补充信息提示用户补充信息图:图:ChatGPT连续调用两个插件连续调用两个插件资料来源:Instacart官网,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理资料来源:Cha
41、tGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件功能的缺点:插件功能的缺点:信息交互、翻译、调用环节都有效率的折损信息交互、翻译、调用环节都有效率的折损1.1.信息交互问题:信息交互问题:自然语言的形式限制了信息交流的效率和准确性。2.2.信息展示信息展示问题问题:部分Plugins使用体验不如直接使用服务官网/APP。特别是在处理信息获取类任务和非标准化需求场景下,没有足够的选择引导用户决策;信息交互问题信息交互问题1.1.ChatGPTChatGPT前处理问题:前处理问题:同时也存在ChatGPT在提炼关键、补齐信息、翻译、拆解任务过程中出错2.2.Chat
42、GPTChatGPT后处理问题:后处理问题:插件反馈并不能满足用户的需求,ChatGPT可能产生幻觉,可能生成虚假或错误的链接。ChatGPT处理问题处理问题1.1.GPTGPT对插件不够了解:对插件不够了解:ChatGPT调用插件都是依赖开发者提供的文档,可能会出现错误调用影响正常调用。例如,插件不支持中文输入,但 ChatGPT输入中文信息导致错误。2.2.用户对插件不了解用户对插件不了解:随着插件越来越多,用户选择合适的插件时遇到困难;插件调用问题插件调用问题图:图:ChatGPT显示商品链接界面显示商品链接界面图:图:ChatGPT信息翻译出错信息翻译出错、链接、链接出错出错图:图:C
43、hatGPT输入插件中文信息输入插件中文信息资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,BIZTOC,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件功能的缺点:功能性能的问题插件功能的缺点:功能性能的问题1.1.插件能力问题:插件能力问题:包括部分插件功能薄弱、水平参差不齐,许多插件使用甚至不如直接调用GPT模型;2.2.插件适用性问题插件适用性问题:多数插件为专用性工具,适用范围窄;插件性能问题插件性能问题1.1.智能的局限性:智能的局限性:GPT模型本身性能有限,某些方面的性能如记忆问题、
44、幻觉问题仍然广泛存在,智能化水平仍有一定的改进空间。ChatGPT性能局限性能局限1.1.插件功能的重复:插件功能的重复:目前插件的开发由开发者完全自主决定,存在大量功能相似的插件,给用户的选择和实际的调用带来了麻烦;插件功能问题插件功能问题图:图:插件无法响应需求插件无法响应需求图:图:ChatGPT捏造链接捏造链接图:图:购物类插件购物类插件资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容如何提升插件体验:优化商店设计帮用户获取合适的插件如何提升插件体
45、验:优化商店设计帮用户获取合适的插件资料来源:ChatGPT Plugin store,APP store,国信证券经济研究所整理 当前Plugin Store较为简陋,只有只有“Popular”“New”“All”“Popular”“New”“All”三个分类、不支持分类和推荐、没有评分和评论功能三个分类、不支持分类和推荐、没有评分和评论功能,随着插件数量快速增长用户寻找合适的插件变得越来越麻烦。参照苹果App Store,合理的商店设计对于开发者和用户体验都有提升,改善方式包括:榜单设置榜单设置:下载量(免费榜)和流水(畅销榜)的排序;个性化推荐个性化推荐:给用户进行个性化推荐;图:图:C
46、hatGPT插件商店与苹果插件商店与苹果APP store请务必阅读正文之后的免责声明及其项下所有内容如何提升插件体验:对常用的插件纳入模型训练如何提升插件体验:对常用的插件纳入模型训练 通过对常用的插件纳入模型训练对常用的插件纳入模型训练,也能从根本上解决使用体验问题,但规模化效率会略低。如:ToolfomerToolfomer可以通过微调大量采样的可以通过微调大量采样的APIAPI调用来学习如何使用不同的工具调用来学习如何使用不同的工具,例如搜索引擎、计算器和翻译系统。类似地,ChatGPT也可以将插件API调用纳入训练,让GPT模型学会什么时候使用插件、使用什么插件,无需用户手动启用。但
47、是,这样只能对已有的插件进行训练,且效率偏低,只能选取最常用的插件进行。图:图:ToolformerToolformer关键步骤关键步骤资料来源:Toolformer:Language Models Can Teach Themselves to Use Tools,国信证券经济研究所整理Toolformer可以通过学习少量的API演示来决定何时调用哪些API、传递什么参数以及如何将结果准确地整合到未来的标记预测中请务必阅读正文之后的免责声明及其项下所有内容快速繁荣但仍有短板的插件生态0101插件与ChatGPT互相赋能,更适合标准化场景0202插件使用体验案例0303目录目录 低门槛的插件开
48、发过程带动插件数量快速增长 插件发布并未带动ChatGPT流量 OpenAI也在推动其他B端策略:API调用、模型商店 插件更适合标准化场景、信息处理类任务 ChatGPT与插件互相赋能,但交互流程与各自性能仍有不足 如何提升插件的体验:优化商店设计、训练模型更好地调用插件风险提示0404请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-办公类:办公类:AskYourPDFAskYourPDF阅读阅读PDFPDF【测试【测试 PromptPrompt】1.请使用askyourpdf插件帮我总结一下这篇文章的内容+ID地址;(文章为国信中文报告)2.请使用askyourpdf插件帮我
49、总结一下这篇文章的内容+网址;(文章为英文网页AI论文)【总结】【总结】1.1.插件无法理解中文,阅读偏离严重插件无法理解中文,阅读偏离严重,返回混乱(官网只支持英文);2.2.ChatGPTChatGPT在接收到不可理解信息后,会出现幻觉问题在接收到不可理解信息后,会出现幻觉问题,自动生成一些无关内容;3.本地文件需要先上传文件到askyourpdf获取ID再读取;图:图:AskyourPDF官网官网对话对话形式形式图:图:AskyourPDF中文阅读出错中文阅读出错图:图:AskyourPDF英文阅读正确英文阅读正确资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,
50、国信证券经济研究所整理资料来源:AskyourPDF官网,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-办公类:办公类:VoxScriptVoxScript、Web copilotWeb copilot读取视频和网页读取视频和网页【测试测试 Prompt】1.请帮我把这个youtube 视频的脚本变成一篇可以阅读的文章+网址;(视频为英伟达COMPUTEX 2023演讲)2.概况总结下面网站的主要内容并用图表展示+网址;(网页为OpenAI GPT4介绍)【总结】【总结】1.读取视频、网页输出基本正确,总结的整体内容比较简单。图:图:ChatGPT调用调用
51、VoxScript图:图:ChatGPT调用调用Web copilot资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-教育教育类:类:WolframWolfram计算计算【测试测试 Prompt】1.求不定积分arctan5x dx,并写出求解过程2.列举深度学习最重要的几个方程或算法并简要解释;【总结】【总结】1.数学计算生成答案准确,提高了提高了ChatGPT的计算能力的计算能力(GPT4直接计算错误);图:图:Wolfram计算正确计算正确图:图:ChatGPT计算错误计算错误资
52、料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-购物类:购物类:InstacartInstacart线下购物线下购物&Shop&Shop导购导购网站网站【测试测试 Prompt】1.请帮我列一份三天减肥晚餐食谱,尽量健康、营养丰富,然后从网络上和本城市门店查找一下关于这些食材的内容,列出商品列表、最优惠价格、对应购买链接。【总结】【总结】1.根据需求ChatGPT生成食谱,再调用生成食谱,再调用Instacart返回一个购买链接(一站式购物)。2.ChatGPT生成食谱调用Shop,将食
53、材挨个输入给Shop(比价网站),分别反馈食材的购买链接。图:图:ChatGPT生成食谱生成食谱图:图:调用调用Instacart图:图:调用调用Shop资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-购物类:购物类:InstacartInstacart线下购物线下购物【总结】【总结】1.Instacart购物链接中的商品名称和实际商品对应不起来,因ChatGPT给的食谱为中文给的食谱为中文Instacart不能识别不能识别。2.Prom
54、pt更换为英文,调用Instacart生成的购物链接正确。图:图:GPT发出中文食谱发出中文食谱图:图:Instacart链接与商品不对应链接与商品不对应图:图:Instacart链接与商品对应链接与商品对应资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,Instacart,国信证券经济研究所整理资料来源:ChatGPT,Instacart,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-购物类:购物类:ShopShop导购导购网站网站【总结】【总结】1.Shop(比价网站)可以识别中文输入,商品链接与食材内容对应。图:图:Shop
55、插件反馈插件反馈链接与商品对应链接与商品对应图:图:Shop插件反馈插件反馈链接与商品对应链接与商品对应资料来源:ChatGPT,Shopify,国信证券经济研究所整理资料来源:ChatGPT,Shopify,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-购物类:购物类:Klarna ShoppingKlarna Shopping自营自营购物平台购物平台【测试测试 Prompt】1.I am currently in New York,please search for Nikke sport shoes,list the products,the bes
56、t prices,and the corresponding purchase links【总结】【总结】1.更换Prompt为耐克鞋,输出商品链接正确。但是返回商品有限,在官网直接搜索结果更直观、全面在官网直接搜索结果更直观、全面。图:图:Klarna Shopping生成鞋子链接生成鞋子链接图:图:Klarna Shopping官网界面官网界面资料来源:ChatGPT,国信证券经济研究所整理资料来源:Klarna Shopping官网,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-出行类:出行类:KayakKayak、ExpediaExpedia酒店机
57、票酒店机票平台平台【测试测试 Prompt】1.帮我预定下周一到周五在纽约的酒店,住5晚。要求是安全、干净、环境安静,价格在500美元/晚以下,再看一下这周日早上从上海飞到纽约的航班,尽量不转机,要求在下周一晚上9:00之前到纽约。【总结】【总结】1.ChatGPT会提取关键信息输入给插件,插件反馈有限的选择(插件反馈有限的选择(GPT有时会限制反馈的数量有时会限制反馈的数量)。)。图:图:ChatGPTChatGPT调用调用Kayak代码代码图:图:Kayak反馈酒店航班信息反馈酒店航班信息图:图:Expedia反馈酒店航班信息反馈酒店航班信息资料来源:ChatGPT,国信证券经济研究所整理
58、资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容插件使用插件使用-金融类:金融类:PortfolioPilotPortfolioPilot投资推荐投资推荐【测试测试 Prompt】1.Recommend the top5 NASDAQ technology stocks worth buying now,explain the reasons and expected returns 2.请推荐5只预期收益率较好的中国互联网股票,说明推荐理由及预期涨幅。3.请推荐5只预期收益率较好的在美股上市的中概股股
59、票,说明推荐理由及预期涨幅。【总结】【总结】1.推荐票走势可以,但都是纽交所股票,不是纳斯达克股票;2.只能针对美股和加拿大地区股票推荐。ChatGPT对中概股理解和翻译错误,生成的还是US股票;图:图:PortfolioPilot反馈股票类型出错反馈股票类型出错图:图:调用调用PortfolioPilot反馈出错反馈出错图:图:ChatGPTChatGPT调用调用PortfolioPilot代码错误代码错误资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容
60、插件使用插件使用-娱乐类:娱乐类:StoriesStories故事与插图故事与插图生成生成【测试测试 Prompt】1.Create a story about little girl and her little cat,with appropriate illustration【总结】【总结】1.生成内容需要点击链接到插件官网查看;2.故事比较简单、平铺直叙,图片生成质量低于图片生成质量低于midjourney等应用等应用,前后文图片没有一致性,整体比较适合童话风格,其他类型内容画风也是童话风格;3.只能生成英文故事只能生成英文故事;图:图:调用调用Stories生成故事生成故事图:图:StoryBird官网官网展示展示资料来源:ChatGPT,国信证券经济研究所整理资料来源:ChatGPT,StoryBird官网,国信证券经济研究所整理