1、新风口新生态新变革新机遇目录新风口:ChatGPT引爆AIGC产业01新生态:AIGC产业生态逐渐完善02新变革:AIGC助力行业转型升级03新机遇:AIGC时代的机遇与挑战0401新风口:ChatGPT引爆AIGC产业1.1OpenAI发展历程1.2ChatGPT技术演进1.3ChatGPT是AIGC浪潮的一部分1.4ChatGPT市场影响力巨大1.5国内外科技企业加码布局AIGC产业OpenAI是由美国一群科技领袖,包括山姆阿尔特曼(SamAltman)、彼得泰尔(PeterThiel)、里德霍夫曼(ReidHoffman)及埃隆马斯克(ElonMusk)等人在2015年12月联合创立的人
2、工智能研究机构。成立次年OpenAI即发布第一个开源AI平台,2020年6月推出OpenAlAPI,正式开启商业化运营。公司在AI领域进程迅猛,于2022年11月发布了ChatGPT产品,作为一款生成式AI,能够协助高效处理文本工作、写代码、编剧等,引发全球对AIGC的积极关注。1.1OpenAI发展历程资料来源:OpenAI官网OpenAI发展里程碑2019年7月2020年6月微软向OpenAI投资了10亿美金,并获得了OpenAl技术的商业化授权。从此,OpenAI的一些技术开始出现在微软的产品和业务上OpenAI发布了第一个开源的AI平台2015年12月OpenAI团队成立OpenAI发
3、布了OpenAlAPI,这是OpenAI推出的一种云端人工智能服务,作为OpenAI第一个商业化产品开启了商业化运作的时代。2022年11月在GPT-3.5的基础上发布ChatGPT,这是一款人工智能聊天机器人OpenAI公司发展里程碑事件梳理2016年3月2018年6月OpenAI发布了GPT模型ChatGPT(ChatGenerativePre-trainedTransformer)是一款人工智能聊天机器人,其背后的GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。1
4、.2.1GPT模型技术演进进程资料来源:CSDNGPT-1有一定的泛化能力,能够用于和监督任务无关的NLP任务中GPT-1(1.17亿参数)GPT-3作为一个自监督模型,可以完成自然语言处理的绝大部分任务:将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的哲学家预测生命的真谛GPT-3(1750亿参数)ChatGPT是InstructGPT的衍生产品,它将人类的反馈纳入训练过程,更好地使模型输出与用户意图保持致ChatGPT除了理解能力外,GPT-2在生成方面表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至可以生成假新闻、钓鱼邮件或在线进行角色扮演GPT-
5、2(15亿参数)InstructGPT是一个经过微调的新版GPT-3,可以将有害的、不真实的和有偏差的输出最小化InstructGPT201820192020-062022-012022-11ChatGPT核心技术主要是基于人工反馈的强化学习(RLHF),具体实现上,人类标注人员扮演用户和代理进行对话,产生对话样本并对回复进行排名打分,将更好的结果反馈给模型,让模型从两种反馈模式人类评价奖励和环境奖励中学习策略,对模型进行持续迭代式微调。1.2.2ChatGPT核心技术RLHF资料来源:OpenAI官网哈尔滨工业大学自然语言处理研究所向一个6岁智力的模型解释强化学习对行为给出奖励与惩罚向一个6
6、岁智力的模型解释强化学习回答A、B、C、DDCAB示例:写一则关于的故事DCAB示例:很久以前rk第一步:收集描述性数据,并训练一个监督学习模型第二步:收集比较性数据,并训练一个奖励模型第三步:用PPO强化学习算法对奖励模型最优化从prompt数据库中取样由人类训练师撰写期望的输出值收集的数据用来以监督学习的方式微调GPT-3.5模型从prompt数据库中取样,并得到数个模型的回答由人类训练师对回答进行排序收集的数据用来训练我们的奖励模型从prompt数据库中另外取样由监督学习初始化PPO模型模型给出回答奖励模型对回答进行打分获得的分数通过PPO算法优化模型ChatGPT采用监督学习+奖励模型