《计算机行业:大模型深度复盘科技变革加速-230522(39页).pdf》由会员分享,可在线阅读,更多相关《计算机行业:大模型深度复盘科技变革加速-230522(39页).pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 计算机计算机 大模型大模型深度复盘,科技变革加速深度复盘,科技变革加速 华泰研究华泰研究 计算机计算机 增持增持 (维持维持)研究员 谢春生谢春生 SAC No.S0570519080006 SFC No.BQZ938 +(86)21 2987 2036 研究员 郭雅丽郭雅丽 SAC No.S0570515060003 SFC No.BQB164 +(86)10 5679 3965 研究员 范昳蕊范昳蕊 SAC No.S0570521060004 +(86)10 6321 1166 联系人 彭钢彭钢 SAC No.
2、S0570121070173 +(86)21 2897 2228 联系人 袁泽世,袁泽世,PhD SAC No.S0570122080053 +(86)21 2897 2228 联系人 林海亮林海亮 SAC No.S0570122060076 +(86)21 2897 2228 行业行业走势图走势图 资料来源:Wind,华泰研究 2023 年 5 月 22 日中国内地 专题研究专题研究 大模型时代已来,大模型时代已来,AGI 新纪元开启新纪元开启 大语言模型(LLM)是在大量数据集上预训练的巨大模型,在处理各种 NLP(自然语言处理)任务方面显示出了较大潜力。2017 年 Transforme
3、r 编解码器架构问世后,成了今年 LLM 发展的蓝图,并由此分化出编码器、编解码器和解码器三条进化路径。其中,编解码器和解码器架构目前仍在不断演进中,且解码器架构在数量上占据绝对优势。全球视角看,LLM 的典型代表是 OpenAI 开发的 GPT 系列模型,国内的百度、智源等也在大模型上进行了深厚的积累。在大模型的赋能下,各种垂类应用和工程实现纷纷落地,包括 BloombergGPT、AutoGPT 等。LLM 或将开启通用人工智能新纪元。溯源:从经典神经网络到溯源:从经典神经网络到 Transformer 架构架构 深度学习可以概括为特征的抽象和结果的预测。深度学习与神经网络密不可分,主要原
4、因是神经网络模型可以使用误差反向传播算法,较好地解决了深度学习中的贡献度分配问题。从历史发展看,神经网络诞生于 1943 年提出的 MP 模型,深度学习概念由 Hinton 于 2006 年正式提出。经过多年的发展,问世了如卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等经典的深度学习算法。2017 年,Transformer 架构的出现成为了后来 LLM 的基础架构,再次开启了大语言模型快速发展时期。发展:从发展:从 GPT-1 到到 GPT-4,开启大模型新纪元开启大模型新纪元 2018 年,OpenAI 提出生成式预训练模型 GPT-1,引入有监督的微调训练。
5、2019 年,GPT-2 以更大的参数量和多任务训练进行 zero-shot 学习;2020年,GPT-3 用 few-shot 代替 zero-shot,并将训练参数增加到 1750 亿,再次提高模型表现性能。2022 年,InstructGPT 引入基于人类反馈的强化学习,实现了更符合人类预期的模型输出。2022 年 11 月,OpenAI 正式推出对话交互式模型 ChatGPT,5 天时间突破了 100 万用户。2023 年 3 月,GPT-4问世,支持多模态输入,并能高水准完成专业考试,支持 API。延伸:国内大模型快速成长,海外大模型多维拓展延伸:国内大模型快速成长,海外大模型多维拓
6、展 大模型时代到来,模型体系与生态快速扩充,海内外企业坚定发力。受益于大模型的理解能力、推理能力、泛化能力得到充分验证,海内外企业纷纷加速大模型相关的产业布局,全面拥抱大模型时代的技术变革。1)国内:)国内:国内大模型发展起步相对较晚,ChatGPT 问世以来国内企业加速大模型研发,2023 年以百度文心、商汤日日新、讯飞星火等为代表的国产大模型相继发布,并持续推进模型迭代升级;2)海外:)海外:海外大模型发展呈现垂直落地、工程实现、模态丰富三大发展趋势,模型体系与配套的工程生态日益丰富。产业链产业链相关公司梳相关公司梳理理 以 GPT 为代表的大模型产业链可分为算力、模型、应用三个环节。1)