《计算机行业:大语言模型的前世、今生与未来-230831(20页).pdf》由会员分享,可在线阅读,更多相关《计算机行业:大语言模型的前世、今生与未来-230831(20页).pdf(20页珍藏版)》请在三个皮匠报告上搜索。
1、 计算机/行业深度分析报告/2023.08.31 请阅读最后一页的重要声明!大语言模型的前世、今生与未来 证券研究报告 投资评级投资评级:看好看好(维持维持)最近 12 月市场表现 分析师分析师 杨烨 SAC 证书编号:S0160522050001 相关报告 1.华为产业系列深度:凤凰磐涅,AI昇腾 2023-08-27 2.大 模 型 推 理 算 力 知 多 少?2023-08-23 3.“活跃资本市场”政策频出,证券 IT迎板块性机遇 2023-08-17 核心观点核心观点 大语言模型:大语言模型:NLP 技术的奇点时刻。技术的奇点时刻。语言模型的核心是对任意一段文本序列进行概率建模,用一
2、个高维向量来表示一个 token 的全部特征。我们将深度学习应用于 NLP 领域的范式转移总结为有监督的机器学习-预训练+微调-预训练+提示。其中,ChatGPT 的横空出世开启了“预训练+提示”的新范式,这主要得益于 OpenAI 对生成类模型(GPT)和算法规模化(Scalability)这两个基础技术路线的成功押注,大语言模型“涌现”出了解决复杂问题的通用能力,催生了本轮全球范围内的生成式 AI 浪潮。大模型应用:数据感知与代理能力。大模型应用:数据感知与代理能力。如何将个人的个性化私有数据和企业多年积累的行业专有知识嫁接到大模型的通用能力上,是大模型在垂直领域商业化落地的核心技术问题。
3、我们在报告中详细列举了三种目前业内主流的实践方法,并对其优劣进行了比较分析。除了获取外部数据外,通过增加代理能力(Agent),让大语言模型具备自主理解、规划、执行复杂任务的能力,同时与计算机内部环境,甚至物理世界进行交互,这也将显著打开大模型应用的想象空间。此外,我们认为提升模型支持的上下文长度是应用创新的关键靶点,模型小型化也将助力大模型应用的商业化落地。应用分析框架:通用能力与外部能力的组合。应用分析框架:通用能力与外部能力的组合。大模型应用可以被总结为,在基座模型的通用能力上,叠加一些其他的可实现的外部能力,这就包括上述的数据感知(可连接其他外部数据源)和代理能力(允许大模型与环境互动
4、)。根据这一范式,我们可以将现阶段大模型的应用边界归纳为通用认知能力与上述两种外部能力的排列组合。基于此,展望未来大模型新应用的靶点可总结为:通用能力的增强(上下文长度、复杂推理、数学、代码、多模态等)、外部能力的扩充(处理非结构化数据、使用更复杂的工具、与物理世界的交互等)投资建议:投资建议:AI 大模型赋能下游应用,C 端标准化工具类产品有望率先享受产业红利,重点公司包括金山办公、万兴科技、同花顺、科大讯飞、福昕软件金山办公、万兴科技、同花顺、科大讯飞、福昕软件等。AI 在 B 端加速落地,具备细分行业数据与客户资源卡位的企业有望优先受益,重点公司包括恒生电子、拓尔思、税友股份恒生电子、拓
5、尔思、税友股份等。算力是 AI 大模型产业化落地的必备环节,建议关注 AI 服务器相关厂商以及国产 AI 芯片厂商:浪潮信浪潮信息、息、中科曙光、优刻得、紫光股份、海光信息、寒武纪、拓维信息、神州数码中科曙光、优刻得、紫光股份、海光信息、寒武纪、拓维信息、神州数码以及在向量数据库及垂直大模型领域有技术优势的星环科技星环科技等。风险提示:风险提示:AI 技术迭代不及预期的风险,商业化落地不及预期的风险,政策支持不及预期风险,全球宏观经济风险。-14%-1%12%25%38%51%计算机沪深300 谨请参阅尾页重要声明及财通证券股票和行业评级标准 2 行业深度分析报告/证券研究报告 1 大语言模型
6、:大语言模型:NLP 技术的奇点时刻技术的奇点时刻.4 1.1 技术探索:深度学习加速推进数据的无损压缩技术探索:深度学习加速推进数据的无损压缩.4 1.2 技术应用:预训练语言模型成为技术应用:预训练语言模型成为 NLP 主流主流.5 1.3 技术跃迁:大语言模型可能打开通往技术跃迁:大语言模型可能打开通往 AGI 之路之路.5 2 OpenAI 与与 GPT:算法、工程、商业的融合:算法、工程、商业的融合.6 2.1 GPT 系列模型的发展历程:千锤百炼,终见系列模型的发展历程:千锤百炼,终见“涌现涌现”.6 2.2 如何训练一个如何训练一个 ChatGPT:预训练获得:预训练获得“智商智