量子位智库:三分钟看懂ChatGPT(8页).pdf

编号:114664 PDF  DOCX 8页 844.29KB 下载积分:VIP专享
下载报告请您先登录!

量子位智库:三分钟看懂ChatGPT(8页).pdf

1、1三分钟看懂三分钟看懂ChatGPTChatGPT量子位智库量子位智库火线报告火线报告智库小助手智库小助手请注明所需社群主题请注明所需社群主题智库负责人智库负责人请注明身份及来意请注明身份及来意分析师:丁乔量子位科技简报ChatGPT2技术技术是什么ChatGPT 是一个基于语言模型 GPT-3.5 的聊天机器人,ChatGPT模型是Instruct GPT的姊妹模型(sibling model),使用强化学习和人类反馈来更好地使语言模型与人类指令保持一致。GPT起源Generative Pre-Trained Transformer(GPT)是一系列基于Transformer 的深度学习语言

2、模型。OpenAI于 2018 年 6 月在题为Improving Language Understanding by Generative Pre-Training的论文中提出了第一个 GPT 模型 GPT-1。从这篇论文中得出的关键结论是,Transformer 架构与无监督预训练的结合产生了可喜的结果。GPT-1 以无监督预训练+有监督微调的方式针对特定任务进行训练以实现“强大的自然语言理解”。2019 年 2 月,OpenAI发表了第二篇论文“Language Models are Unsupervised Multitask Learners”,其中介绍了由GPT-1演变的GPT-2

3、。尽管 GPT-2 大了一个数量级,但它们在其他方面非常相似。两者之间只有一个区别:GPT-2 可以完成多任务处理。OpenAI成功地证明了半监督语言模型可以在“无需特定任务训练”的情况下,在多项任务上表现出色。该模型在零样本任务转移设置中取得了显著效果。随后,2020年5月,OpenAI发表Language Models are Few-Shot Learners,呈现GPT-3。GPT-3 比 GPT-2 大 100 倍,它拥有1750 亿个参数。然而,它与其他 GPT 并没有本质不同,基本原则大体一致。尽管 GPT 模型之间的相似性很高,但 GPT-3 的性能仍超出了所有可能的预期。20

4、22年11月底,围绕ChatGPT机器人,OpenAI进行了两次更新。11月29日,OpenAI发布了一个命名为“text-davinci-003”(文本-达芬奇-003”)的新模式。在11月30日发布它的第二个新功能:“对话”模式。它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。工作原理工作原理概述使用机器学习算法来分析和理解文本输入的含义,然后根据该输入生成响应。该模型在大量文本数据上进行训练,使其能够学习自然语言的模式和结构。细节ChatGPT 模型使用一种称为人类反馈强化学习(RLHF)的机器学习进行训练,可以模拟对话、回答后续问题、承认错

5、误、挑战不正确的前提并拒绝不适当的请求。为了创建强化学习的奖励模型,OpenAI收集了比较数据,其中包含两个或多个按质量排序的响应模型。为了使生成的文本更容易被人理解,OpenAI招募了人类训练师,在训练过程中,人类训练师扮演了用户和人工智能助手的角色。模型在Microsoft Azure的超算设施上进行训练。ChatGPTChatGPT模型的训练过程与其前身模型的训练过程与其前身RLHFRLHF非常相似:非常相似:1.使用有监督的微调训练初始模型:人类训练师之间提供对话,其中一个扮演用户,另一个扮演ChatGPT 中的 AI 助手。为了创建强化学习的奖励模型,需要收集比较数据,并使用收集到的

6、数据调整 GPT-3.5 模型;量子位科技简报ChatGPT3谁出的谁出的ChatGPT由OpenAI开发,采用基于GPT-3.5架构的大型语言模型。OpenAI 是一家位于旧金山的研究实验室,成立于 2015 年,由其首席执行官Sam Altman、Elon Musk以及风险投资家Peter Thiel等人共同出资10亿美元建立。OpenAI的诞生旨在开发通用人工智能(AGI),并确保其成为一种高度自主、且在大多数具有经济价值的工作上超越人类的系统。而GPT正是OpenAI通过文字模态来探索通用人工智能的一种方式。OpenAI研究方向训练生成模型(Training Generative Mo

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(量子位智库:三分钟看懂ChatGPT(8页).pdf)为本站 (分析师) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠