《量子位智库:三分钟看懂ChatGPT(8页).pdf》由会员分享,可在线阅读,更多相关《量子位智库:三分钟看懂ChatGPT(8页).pdf(8页珍藏版)》请在三个皮匠报告上搜索。
1、1三分钟看懂三分钟看懂ChatGPTChatGPT量子位智库量子位智库火线报告火线报告智库小助手智库小助手请注明所需社群主题请注明所需社群主题智库负责人智库负责人请注明身份及来意请注明身份及来意分析师:丁乔量子位科技简报ChatGPT2技术技术是什么ChatGPT 是一个基于语言模型 GPT-3.5 的聊天机器人,ChatGPT模型是Instruct GPT的姊妹模型(sibling model),使用强化学习和人类反馈来更好地使语言模型与人类指令保持一致。GPT起源Generative Pre-Trained Transformer(GPT)是一系列基于Transformer 的深度学习语言
2、模型。OpenAI于 2018 年 6 月在题为Improving Language Understanding by Generative Pre-Training的论文中提出了第一个 GPT 模型 GPT-1。从这篇论文中得出的关键结论是,Transformer 架构与无监督预训练的结合产生了可喜的结果。GPT-1 以无监督预训练+有监督微调的方式针对特定任务进行训练以实现“强大的自然语言理解”。2019 年 2 月,OpenAI发表了第二篇论文“Language Models are Unsupervised Multitask Learners”,其中介绍了由GPT-1演变的GPT-2
3、。尽管 GPT-2 大了一个数量级,但它们在其他方面非常相似。两者之间只有一个区别:GPT-2 可以完成多任务处理。OpenAI成功地证明了半监督语言模型可以在“无需特定任务训练”的情况下,在多项任务上表现出色。该模型在零样本任务转移设置中取得了显著效果。随后,2020年5月,OpenAI发表Language Models are Few-Shot Learners,呈现GPT-3。GPT-3 比 GPT-2 大 100 倍,它拥有1750 亿个参数。然而,它与其他 GPT 并没有本质不同,基本原则大体一致。尽管 GPT 模型之间的相似性很高,但 GPT-3 的性能仍超出了所有可能的预期。20
4、22年11月底,围绕ChatGPT机器人,OpenAI进行了两次更新。11月29日,OpenAI发布了一个命名为“text-davinci-003”(文本-达芬奇-003”)的新模式。在11月30日发布它的第二个新功能:“对话”模式。它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。工作原理工作原理概述使用机器学习算法来分析和理解文本输入的含义,然后根据该输入生成响应。该模型在大量文本数据上进行训练,使其能够学习自然语言的模式和结构。细节ChatGPT 模型使用一种称为人类反馈强化学习(RLHF)的机器学习进行训练,可以模拟对话、回答后续问题、承认错
5、误、挑战不正确的前提并拒绝不适当的请求。为了创建强化学习的奖励模型,OpenAI收集了比较数据,其中包含两个或多个按质量排序的响应模型。为了使生成的文本更容易被人理解,OpenAI招募了人类训练师,在训练过程中,人类训练师扮演了用户和人工智能助手的角色。模型在Microsoft Azure的超算设施上进行训练。ChatGPTChatGPT模型的训练过程与其前身模型的训练过程与其前身RLHFRLHF非常相似:非常相似:1.使用有监督的微调训练初始模型:人类训练师之间提供对话,其中一个扮演用户,另一个扮演ChatGPT 中的 AI 助手。为了创建强化学习的奖励模型,需要收集比较数据,并使用收集到的
6、数据调整 GPT-3.5 模型;量子位科技简报ChatGPT3谁出的谁出的ChatGPT由OpenAI开发,采用基于GPT-3.5架构的大型语言模型。OpenAI 是一家位于旧金山的研究实验室,成立于 2015 年,由其首席执行官Sam Altman、Elon Musk以及风险投资家Peter Thiel等人共同出资10亿美元建立。OpenAI的诞生旨在开发通用人工智能(AGI),并确保其成为一种高度自主、且在大多数具有经济价值的工作上超越人类的系统。而GPT正是OpenAI通过文字模态来探索通用人工智能的一种方式。OpenAI研究方向训练生成模型(Training Generative Mo
7、dels)从数据中推断算法(algorithms for inferring algorithms from data)强化学习的新方法(new approaches to reinforcement learning)大致代表了以下三个研究主题:Deep Generative Model 深度生成模型Neural Turing Machine 神经图灵机Deep Reinforcement Learning 深度强化学习OpenAI近况研究进展研究进展2022 年 11 月,OpenAI 向公众开放了使用对话进行交互的ChatGPT;2022年9月,OpenAI发布了一个名为 Whisper
8、 的神经网络,称其在英语语音识别方面能够接近人类水平的鲁棒性和准确性。Whisper 是一种自动语音识别(ASR)系统,使用从网络收集的68万小时、多语言和多任务监督数据进行训练;2021年,OpenAI 宣布将通过 API 向企业和开发者提供访问其 Codex 程序的机会。Codex是一种基于GPT-3的自然语言代码系统,有助于将简单的英语指令转换为十几种流行的编码语言;2021 年 1 月,OpenAI 推出了DALL-E。一年后,他们的最新系统 DALLE 2 生成了更逼真、更准确的图像,分辨率提高了4倍。投融资投融资OpenAI最近一次融资在2019年,获得微软10亿美元的投资。此外,
9、OpenAI也在进行对外投资,去年推出Start Fund,与合作伙伴(包括微软)一同投资处于早期阶段的专注于能使AI在领域内(如气候变化、医疗、教育等)产生变革性影响的公司。目前,Start Fund已投资4家公司,分别是Descript、Harvey AI、Mem和 Speak,它们在大规模重塑创造力、辅助律师工作、提高知识工作者的生产力和教育方面具有巨大潜力。2.模型会根据提示生成多个输出,训练师将 ChatGPT 编写的回复与人类的回答进行比较,并对它们的质量进行排名,以帮助强化机器的类人对话风格。奖励模型将自动执行最后一个训练阶段,使用排名后的数据训练;3.在最后一步使用近端策略优化
甲子光年:中国AI产业地图研究(55页).pdf
财经城市规划设计研究院:2022县域高质量发展年度指数报告(90页).pdf
盛世华研:2019-2025年中国新能源汽车电机行业技术发展趋势研究报告(77页).pdf
5GDNA:5G工业互联赋能5G全连接工厂技术白皮书(19页).pdf
金蝶国际-星空璀璨苍穹之光照耀云化之路-221122(47页).pdf
酒鬼酒内参酒鬼双轮驱动全国化布局成效可期-221122(27页).pdf
赛力斯-投资价值分析报告:携手华为开启智能汽车二次创业-221122(39页).pdf
景津装备-传统市场扩容新兴市场扩张压滤龙头受益-221122(29页).pdf
康缘药业-传承中药守正创新-221123(33页).pdf
多氟多-投资价值分析报告:挺进新能源和新材料未来业绩加速增长可期-221123(20页).pdf
海尔智家-投资价值分析报告:前瞻性全球化及高端市场布局、数字化改革助力业绩逆势高速增长-221122(27页).pdf
机械设备行业深度报告:实验分析仪器系列专题光谱仪市场规模持续提升国产替代大有可为-221123(17页).pdf
计算机行业人工智能系列报告(三):虚拟电厂与智能巡检电力AI地最佳落地场景-230329(18页).pdf
京东科技:服销一体化趋势下ChatAl如何助力品牌高“智”量增长(2023)(16页).pdf
量子位:2023中国AIGC产业全景报告(53页).pdf
AI行业跟踪报告之九:GPT4全方位升级AI商业化时代来临-230329(41页).pdf
人工智能行业系列深度报告:计算机视觉行业框架AI之眼初启商业飞轮-230329(57页).pdf
InfoQ研究中心:中国开源生态图谱2022-人工智能领域(25页).pdf
人工智能行业专题报告:生成式人工智能产业全梳理-230328(80页).pdf
AI应用计算机行业深度研究:不止于AI探索AI+研发设计工业软件星辰大海-230326(21页).pdf
GPU行业深度研究:AI大模型浪潮风起GPU芯片再立潮头-230326(86页).pdf
GPU行业深度报告:走进“芯”时代系列深度之六十“AI算力GPU”AI产业化再加速智能大时代已开启-230326(121页).pdf
蜜雪冰城招股说明书-连锁茶饮第一股(724页).pdf
线上健身第一股-keep招股说明书(463页).pdf
麦肯锡:2023中国消费者报告:韧性时代(33页).pdf
罗振宇2023“时间的朋友”跨年演讲完整PDF.pdf
QuestMobile:2022新中产人群洞察报告(37页).pdf
QuestMobile:2022年中国短视频直播电商发展洞察报告(30页).pdf
小红书:2023年度生活趋势报告(34页).pdf
町芒:2022现制茶饮行业研究报告(47页).pdf
QuestMobile:2021新中产人群洞察报告(30页).pdf
锐仕方达&薪智:2022年薪酬白皮书(105页).pdf