计算机行业深度:“大模型”系列(5)大模型研究框架(2025)-250420(58页).pdf

编号:627423 PDF  PPTX 58页 6.29MB 下载积分:VIP专享
下载报告请您先登录!

计算机行业深度:“大模型”系列(5)大模型研究框架(2025)-250420(58页).pdf

1、计算机行业深度计算机行业深度:大模型研究框架(大模型研究框架(20252025)“大模型大模型”系列(系列(5 5)评级:推荐(维持)证券研究报告2025年04月20日计算机刘熹(证券分析师)郭义俊(联系人)S0350523040001S请务必阅读报告附注中的风险提示和免责声明2相对沪深300表现表现1M3M12M计算机-17.7%3.6%26.0%沪深300-5.9%-1.0%5.7%最近一年走势相关报告计算机“人工智能”系列专题:AutoGLM沉思:DeepResearch+Operator,开启智能体新阶段(推荐)*计算机*刘熹2025-04-17计算机行业深度报告:关税对自主可控的影响

2、拆解计算机“自主可控”系列报告(3)(推荐)*计算机*刘熹2025-04-11服务器电源:AI芯片功耗提升,高功率电源景气上行AI算力“卖水人”系列(五)(推荐)*计算机*刘熹2025-03-10-25%-8%10%27%45%62%2024/04/152024/06/152024/08/152024/10/152024/12/152025/02/152025/04/15计算机沪深300请务必阅读报告附注中的风险提示和免责声明3核心提要核心提要u大模型发展回顾:以大模型发展回顾:以Transformer为基,为基,Scaling law贯穿始终贯穿始终2017年谷歌团队提出Transforme

3、r架构,创造性推动注意力层以及前馈神经网络层的发展,加速提升模型性能。20182020年是预训练Transformer模型时代,GPT-3以1750亿参数突破大规模预训练的可能性界限,而SFT及RLHF等技术帮助模型加速对齐人类价值观。此后随着训练侧Scaling Law描述的幂律关系出现收益递减,叠加高质量文本数据或逐步被AI耗尽,推理模型开始进入人们视野;以OpenAI发布o1-preview将AIME 2024的模型回答准确率从GPT4o的13.4%提升至56.7%,模型维持加速迭代更新。u国内大模型进展:行业充分竞争,降本提效为主旋律国内大模型进展:行业充分竞争,降本提效为主旋律资源有

4、限的条件下资源有限的条件下,预计低成本高性能追平海外预计低成本高性能追平海外SOTA为为2025年国产大模型的主题年国产大模型的主题。我们以DeepSeek、豆包、阿里千问为例,1)DeepSeek-R1/V3依靠创新的降本提效手段,核心旨在资源有限的条件下,极大提升GPU在计算/通信上的利用率。2)豆包大模型在2024年下半年发力,月活数据冲上全球第二和国内第一;同样在降本增效范式上依靠稀疏MoE架构实现小参数高性能;3)阿里Qwen引领国产开源模型标杆的同时,依靠强化学习范式推出的QwQ-32B已登顶全球最强开源模型,以32B参数模型追平DeepSeek-R1满血模型性能,小参数高性能持续

5、成为主旋律。u海外大模型进展:海外大模型进展:资源头部集中,押注资源头部集中,押注AGI算力充沛条件下算力充沛条件下,资源倾斜押注资源倾斜押注AGI。1)OpenAI:推理模型o1、多模态模型Sora均实现了行业引领,2025年来CEO Altman多次提及将发布OpenAI的首款Agent,且2025年也会是Agent爆发的元年;2)Google:前瞻布局原生多模态Gemini,2024年底发布多款Agent产品,同时布局轻量化模型Gemma抢占端侧生态;3)Meta:2024年12月Llama3.3以70B参数实现Llama3.1 405B的性能;基于Meta Live已实现实时语音交互、

6、跨设备协作能力,发力通用智能体;4)2024年10月Claude3.5 Sonnet升级新增computer use能力,让Claude像人一样使用电脑;此外,2025年抢先发布混合推理模型Claude-3.7-sonnet。请务必阅读报告附注中的风险提示和免责声明4核心提要核心提要u模型未来研判:投注后训练模型未来研判:投注后训练+算法大幅优化算法大幅优化,低成本落地低成本落地+实现实现AGI为终极目标为终极目标模型在架构以及模型在架构以及pre-trainingpost training落地层面均迎来加速变革落地层面均迎来加速变革。1)模型架构层面)模型架构层面,MoE与Transform

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(计算机行业深度:“大模型”系列(5)大模型研究框架(2025)-250420(58页).pdf)为本站 (卢旭先生) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠