《电子行业AI的进击时刻系列13:英伟达GTC大会开幕走向代理式AI&物理AI时代-250319(23页).pdf》由会员分享,可在线阅读,更多相关《电子行业AI的进击时刻系列13:英伟达GTC大会开幕走向代理式AI&物理AI时代-250319(23页).pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、 识别风险,发现价值 请务必阅读末页的免责声明 1 1/2323 Table_Page 行业专题研究|电子 2025 年 3 月 19 日 证券研究报告 AI 的进击时刻系列的进击时刻系列 13 英伟达英伟达 GTC 大会开幕,走向大会开幕,走向代理式代理式 AI&物理物理 AI 时代时代 分析师:分析师:王亮 分析师:分析师:耿正 分析师:分析师:张大伟 SAC 执证号:S0260519060001 SFC CE.no:BFS478 SAC 执证号:S0260520090002 SAC 执证号:S0260523050001 021-38003658 021-38003660 021-3800
2、3657 请注意,耿正,张大伟并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。核心观点:核心观点:根据英伟达官网,英伟达根据英伟达官网,英伟达 GTC 大会开幕,黄仁勋发表主题演讲。大会开幕,黄仁勋发表主题演讲。黄仁勋表示,AI 已经从最初的感知式 AI,发展至生成式 AI,预计将进入代理式 AI(Agentic AI)和物理 AI(Physical AI)的时代。英伟达发布分布式推理服务库英伟达发布分布式推理服务库 NVIDIA Dynamo。在推理过程中,数据中心需要兼顾总输出量(tokens per second for factory)和快速响应(tokens
3、per second for one user),推理过程中常使用多种并行策略。英伟达推出了分布式推理服务库 Nvidia Dynamo,分解推理过程中的 prefill 和 decode 阶段,动态分配两个流程的GPU。Grace Blackwell NVLink72 芯片搭载 Dynamo 服务库后,相比 Hopper 架构性能提升 25 倍。从 Token Revenue 的角度上来看,同样在功耗为 100MW 的 AI Factory 中,Blackwell 的产出是 Hopper 的 40 倍。英伟达发布英伟达发布 Blackwell Ultra 和下一代和下一代 Vera Rubi
4、n AI 超级芯片。超级芯片。英伟达将在 2025 年下半年推出增强训练和测试时间扩展推理能力的 Blackwell Ultra 芯片和 Blackwell Ultra NVL72。对于 Blackwell Ultra NVL72,其 FP4 推理算力达到 1.1EF,是 GB200 NVL72 的 1.5 倍。Vera Rubin 和 Vera Rubin NVL144 将在 2026 年下半年开始出货,将采用 NVLink 144,每个 GPU 可以与其他 144 个 GPU 相连接,其 FP4 推理算力为 3.6EP,为 GB300 NVL72 的 3.3 倍。2027 年下半年,将推出
5、由四个 GPU 组成的 Vera Rubin Ultra,FP4 算力为 100PF,并将配备 1TB 的 HBM4e。机柜版本则将升级为 Vera Rubin Ultra NVL576,其 FP4 推理算力为 15EP,为 GB300 NVL72 的 14 倍。英伟达发布英伟达发布 CPO 交换机。交换机。Quantum-X Photonic Switch 支持 115.2Tb/s 的交换速率,预计于 2025 年下半年推出,支持 144 个 800G 网口/576 个 200G 网口。以太网协议交换机 Spectrum-X Photonic Switch 预计于 2026年下半年推出,最大
6、支持 512 个 800G 网口/2000 个 200G 网口,可以将 GPU 集群规模扩展到 10 万个。英伟达发布通用的机器人基础模型英伟达发布通用的机器人基础模型 GR00T N1。GR00T N1 是全球首款开源的人形机器人功能模型,同时,英伟达与谷歌 DeepMind 以及迪士尼 Research 正合作开发,专为机器人学习设计的物理引擎 Newton,预计将于今年推出。投资建议:投资建议:AI 的进击时刻,Scaling law 三轮驱动,AI 模型和 AI 应用快速发展,AI 硬件产业链深度受益;DeepSeek 有望引领开源生态,驱动国产 AI 产业链蓬勃发展,英伟达推动产业持
7、续升级,建议关注产业链相关标的。风险提示。风险提示。行业周期波动风险,AI 行业发展不及预期风险,新技术进展不及预期风险。相关研究相关研究:AI 的进击时刻系列 12:DeepSeek One More Thing 2025-03-05 AI 的进击时刻系列 11:国内 CSP CapEx 超预期,强化 AI 需求逻辑 2025-02-24 AI 的进击时刻系列 10:国产 8 卡服务器 PCIe retimer 市场规模测算 2025-02-23 识别风险,发现价值 请务必阅读末页的免责声明 2 2/2323 Table_PageText 行业专题研究|电子 重点公司估值和财务分析表重点公司
8、估值和财务分析表 股票简称股票简称 股票代码股票代码 货币货币 最新最新 最近最近 评级评级 合理价值合理价值 EPS(元元)PE(x)EV/EBITDA(x)ROE(%)收盘价收盘价 报告日期报告日期(元(元/股)股)2024E 2025E 2024E 2025E 2024E 2025E 2024E 2025E 立讯精密 002475.SZ CNY 40.86 2024/11/04 买入 48.45 1.89 2.42 21.62 16.88 12.45 10.69 19.30 19.80 北方华创 002371.SZ CNY 438.67 2024/10/30 买入 464.11 11.0
9、4 14.13 39.73 31.05 31.52 24.97 19.70 20.20 中微公司 688012.SH CNY 204.00 2024/08/25 买入 176.31 2.97 4.15 68.69 49.16 91.54 68.22 9.60 11.80 澜起科技 688008.SH CNY 78.54 2024/10/31 买入 80.40 1.24 1.97 63.34 39.87 61.21 38.91 12.10 16.20 兆易创新 603986.SH CNY 129.91 2024/11/06 买入 102.82 1.71 2.73 75.97 47.59 62.9
10、7 40.44 7.10 10.10 长电科技 600584.SH CNY 37.51 2024/10/27 买入 45.88 0.91 1.43 41.22 26.23 13.38 11.93 5.90 8.50 卓胜微 300782.SZ CNY 87.31 2024/10/31 买入 100.21 1.17 1.82 74.62 47.97 35.30 24.26 5.90 8.40 沪硅产业 688126.SH CNY 19.41 2024/04/14 买入 26.52 0.09 0.12 215.67 161.75 33.45 26.00 1.60 2.10 拓荆科技 688072.
11、SH CNY 179.33 2024/10/29 买入 243.87 2.20 3.28 81.51 54.67 68.53 49.47 12.40 15.60 晶升股份 688478.SH CNY 33.90 2024/05/06 买入 49.95 1.12 1.73 30.27 19.60 29.69 18.25 9.00 12.20 盛美上海 688082.SH CNY 105.90 2024/08/08 买入 145.74 2.83 3.87 37.42 27.36 30.47 22.35 16.20 18.10 华海清科 688120.SH CNY 165.94 2024/10/30
12、 买入 213.06 4.41 5.60 37.63 29.63 33.04 25.59 16.30 17.10 东山精密 002384.SZ CNY 37.08 2024/05/06 买入 26.27 1.30 1.56 28.52 23.77 11.37 10.08 10.80 11.20 胜宏科技 300476.SZ CNY 91.51 2024/10/29 买入 53.69 1.39 2.15 65.83 42.56 26.83 19.89 13.90 15.60 晶晨股份 688099.SH CNY 82.99 2024/10/30 买入 84.62 1.88 2.75 44.14
13、30.18 36.38 26.03 12.40 15.40 斯达半导 603290.SH CNY 96.85 2024/04/09 买入 229.93 6.56 8.38 14.76 11.56 15.76 12.57 14.80 16.00 天岳先进 688234.SH CNY 70.69 2024/05/04 买入 85.76 0.40 0.73 176.72 96.84 54.63 41.96 3.20 5.60 中科飞测 688361.SH CNY 93.30 2024/04/30 买入 94.88 0.61 0.90 152.95 103.67 125.97 89.93 7.50 9
14、.80 唯捷创芯 688153.SH CNY 36.90 2024/04/29 买入 64.84 0.93 1.22 39.68 30.25 35.34 24.52 8.70 10.10 恒玄科技 688608.SH CNY 369.50 2024/09/06 买入 169.64 2.42 4.31 152.69 85.73 149.85 94.78 4.60 7.50 南芯科技 688484.SH CNY 37.51 2024/03/20 买入 47.89 0.87 1.19 43.11 31.52 42.67 30.63 8.50 10.40 聚辰股份 688123.SH CNY 82.5
15、4 2024/04/30 买入 84.03 2.79 4.21 29.58 19.61 24.99 17.11 18.30 21.70 数据来源:Wind、广发证券发展研究中心 备注:表中估值指标按照最新收盘价计算 识别风险,发现价值 请务必阅读末页的免责声明 3 3/2323 Table_PageText 行业专题研究|电子 目录索引目录索引 一、英伟达:走向代理式 AI&物理 AI 时代.6 二、AI 模型与应用.15(一)AI 模型.15(二)AI 应用.20 三、投资建议.21 四、风险提示.21 识别风险,发现价值 请务必阅读末页的免责声明 4 4/2323 Table_PageTe
16、xt 行业专题研究|电子 图表索引图表索引 图 1:AI 时代演变.6 图 2:scaling law.6 图 3:CSP 厂商 NVIDIA GPU 采购量.7 图 4:数据中心资本支出预测.7 图 5:CUDA X.7 图 6:推理需综合考虑吞吐量和响应时间.8 图 7:NVIDIA Dynamo.8 图 8:Blackwell 搭载 Dynamo 后性能提升.8 图 9:Blackwell 推理性能.8 图 10:Blackwell Ultra NVL72.9 图 11:Vera Rubin NVL144.9 图 12:Vera Rubin Ultra NVL576.9 图 13:NVI
17、DIA Blackwell System.10 图 14:NVIDIA Rubin System.10 图 15:Rubin GPU 参数对比.10 图 16:英伟达 CPO Photonic Switch.11 图 17:NVIDIA Photonic.11 图 18:NVIDIA 交换机推出时间.11 图 19:英伟达 Road Map.12 图 20:DGX Spark 和 DGX Station.13 图 21:英伟达与通用汽车.13 图 22:英伟达 Halos.13 图 23:机器人基础模型 GROOT N1.14 图 24:机器人模拟用开源、物理引擎 Newton.14 图 25
18、:GPT 模型结构.15 图 26:MOE 模型.15 图 27:GPT-3 的完整工作流程.15 图 28:训练 scaling law.17 图 29:推理 scaling law.17 图 30:大语言模型公开学术榜单.19 图 31:多模态模型公开学术榜单.19 图 32:大模型对硬件系统需求多样性.19 图 33:AI 应用 APP 访问量.20 图 34:AI 应用 web 访问量.20 识别风险,发现价值 请务必阅读末页的免责声明 5 5/2323 Table_PageText 行业专题研究|电子 表 1:GPT-3.5 模型参数符号.16 表 2:GPT-3.5 模型参数组成.
19、16 表 3:scaling law 解释.16 表 4:模型训练的并行策略.18 表 5:OpenAI 主要模型信息表.18 表 6:AI 终端进展.20 识别风险,发现价值 请务必阅读末页的免责声明 6 6/2323 Table_PageText 行业专题研究|电子 一、英伟达:走向代理式一、英伟达:走向代理式 AI&物理物理 AI 时代时代 2025年3月19日,英伟达CEO黄仁勋在2025年GTC大会上发表主题演讲。黄仁勋表示,AI已经从最初的感知式AI,发展至生成式AI,将进入代理式AI(Agentic AI)和物理AI(Physical AI)的时代。图图 1:AI时代演变时代演变
20、 数据来源:NVIDIA 官网,广发证券发展研究中心 对于scaling law的发展,将会遵从(1)预训练扩展、(2)后训练扩展、(3)测试时间扩展,即“长思维”链的演进过程。黄仁勋表示,“AI的scaling law更具弹性,且实际上速度在超快提高(hyper-accelerated)。”图图 2:scaling law 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 7 7/2323 Table_PageText 行业专题研究|电子 对于日益增长的计算需求,黄仁勋表示,2024年美国前四大CSP厂商购买了130万块英伟达的Hopper架构
21、芯片,2025年,预计将购买360万Blackwell架构芯片。同时,预计到2028年,建设数据中心的资本支出将超过1万亿美元。图图 3:CSP厂商厂商NVIDIA GPU采购量采购量 图图 4:数据中心资本支出预测数据中心资本支出预测 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 GTC大会上,黄仁勋展示了英伟达与应用于各行业各学科AI加速的CUDA-X库,包括天文学、粒子物理学、量子物理学、汽车、航空航天和半导体设计等领域。图图 5:CUDA X 数据来源:NVIDIA 官网,广发证券发展研究中心 针对Reasoning Model
22、(思维连模型)的推理,相较于传统的大语言模型,每个人工智能模型都会生成数以万计的token,用于在每次提示时“思考”,对于算力和token数都提出了更高的要求。在推理过程中,数据中心需要兼顾总输出量(tokens per second for factory)和快速响应(tokens per second for one user)。在大量GPU中高效编排和协调AI推理请求对于确保AI工厂以最低成本运行以最大化token收入至关重要。为此,推理过程中常使用多种并行策略,以获得大吞吐量和低延时。英伟达推出了分布式推理服务库NVIDIA Dynamo,分解推理过程中的prefill和decode阶
23、段,动态 识别风险,发现价值 请务必阅读末页的免责声明 8 8/2323 Table_PageText 行业专题研究|电子 调整GPU在两个流程中的分配,用于解决无法提供足够用户所需token的问题,以获得更好的经济效益。图图 6:推理需综合考虑吞吐量和响应时间推理需综合考虑吞吐量和响应时间 图图 7:NVIDIA Dynamo 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 从性能结果上来看,Grace Blackwell NVLink72芯片搭载Dynamo服务库后,相比Hopper架构可将性能提升25倍。此外,黄仁勋表示,从Toke
24、n Revenue的角度上来看,同样在100MW的AI Factory中,Blackwell的产出是Hopper的40倍。图图 8:Blackwell搭载搭载Dynamo后性能提升后性能提升 图图 9:Blackwell推理性能推理性能 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 对于芯片与机柜的升级,黄仁勋在对于芯片与机柜的升级,黄仁勋在GTC大会上展示了大会上展示了Blackwell Ultra和下一代和下一代Vera Rubin AI超级芯片。超级芯片。黄仁勋表示,Grace Blackwell已全面投入生产,2025年下半年将
25、推出增强了训练和测试时间扩展推理的Blackwell Ultra芯片以及Blackwell Ultra NVL72。对于Blackwell Ultra NVL72,其FP4推理算力达到1.1EF,是GB200 NVL72的1.5倍,并搭载了20TB的HBM和40TB的Fast Memory,并支持14.4TB/s的CX8交换机。Vera Rubin将在2026年下半年开始出货。Vera Rubin和Grace Blackwell类似,集成了CPU和GPU。在Grace Blackwell中,Grace是CPU,Blackwell是GPU;而在Vera Rubin中,Vera是CPU,Rubin
26、是GPU。Rubin GPU FP4算力为50PF,并将配备288GB的HBM4。此外,对于Rubin来说,其机柜版本将升级为Vera Rubin NVL144,意味着Scale up将采用NVLink 144,着每个GPU可以与其他144个GPU相连接。其FP4推理算力为3.6EP,为GB300 NVL72的3.3倍。识别风险,发现价值 请务必阅读末页的免责声明 9 9/2323 Table_PageText 行业专题研究|电子 预计到2027年下半年,英伟达将推出Vera Rubin Ultra,每个Rubin处理器由两个GPU组成一个单芯片,而Rubin Ultra则由四个GPU组成,F
27、P4算力为100PF,并将配备1TB的HBM4e。对于机柜版本,则将继续升级为Vera Rubin Ultra NVL576,意味着Scale up将采用NVLink 576,实现极致规模扩展。其FP4推理算力为15EP,为GB300 NVL72的14倍。图图 10:Blackwell Ultra NVL72 图图 11:Vera Rubin NVL144 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 图图 12:Vera Rubin Ultra NVL576 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务
28、必阅读末页的免责声明 1010/2323 Table_PageText 行业专题研究|电子 同时黄仁勋还展示了超级芯片NVIDIA Vera Rubin NVL576。在一个晶圆上集成了576个Rubin GPU,有144个NVLink Switch,实现FP4上15 EFLOPS的计算性能。图图 13:NVIDIA Blackwell System 图图 14:NVIDIA Rubin System 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 从参数对比的角度上来看,黄仁勋表示,Rubin的新能能可达到Hopper的900倍,而Bl
29、ackwell则是Hopper的68倍。从经济来考量,Rubin的TCO/Perf则为Hopper的0.03。图图 15:Rubin GPU参数对比参数对比 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1111/2323 Table_PageText 行业专题研究|电子 在网络连接层面,英伟达正式推出在网络连接层面,英伟达正式推出CPO交换机交换机Quantum-X Photonic Switch。支持115.2Tb/s的交换速率。IB协议交换机Quantum-X Photonic Switch预计于2025年下半年推出,支持144个800
30、G网口/576个200G网口。以太网协议交换机Spectrum-X Photonic Switch预计于2026年下半年推出,最大支持512个800G网口/2000个200G网口,可以将GPU集群规模扩展到10万个。图图 16:英伟达英伟达CPO Photonic Switch 数据来源:NVIDIA 官网,广发证券发展研究中心 图图 17:NVIDIA Photonic 图图 18:NVIDIA交换机推出时间交换机推出时间 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1212/2323
31、Table_PageText 行业专题研究|电子 本次GTC大会上,依照惯例,英伟达继续展示了其Road Map。黄仁勋表示,Rubin之后的下一代GPU架构将命名为Feynman(物理学家理查德-费曼),预计该架构将于2028年亮相。图图 19:英伟达英伟达Road Map 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1313/2323 Table_PageText 行业专题研究|电子 对于企业级计算,黄仁勋表示,宣布将发布两款“AI时代的计算机”:DGX Spark和DGX Station。其均都使用Blackwell架构芯片。DGX
32、Spark采用GB10 Grace Blackwell超级芯片。DGX Station,由GB300 Grace Blackwell Ultra Desktop芯片驱动。图图 20:DGX Spark和和DGX Station 数据来源:NVIDIA 官网,广发证券发展研究中心 对于物理AI时代的机器人和智能驾驶,英伟达在此次GTC大会上均有所更新。对于智能驾驶,黄仁勋表示几乎每家自动驾驶公司都使用了大量NVIDIA的GPU,同时,黄仁勋宣布将扩大与通用汽车的合作。通用汽车将运用英伟达的技术帮助开发自动驾驶汽车,用英伟达的技术训练AI制造模型。同时,英伟达推出了专注于汽车安全的AI解决方案Ha
33、los,从芯片级到系统级来确保行车安全。图图 21:英伟达与英伟达与通用汽车通用汽车 图图 22:英伟达:英伟达Halos 数据来源:NVIDIA 官网,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1414/2323 Table_PageText 行业专题研究|电子 机器人方面,英伟达宣布推出通用的机器人基础模型GR00T N1,它是全球首款开源的人形机器人功能模型,并推出Simulation Frameworks,用于加速机器人开发。此外,英伟达与谷歌DeepMind以及迪士尼Research正合作开发机器人模拟用的
34、开源、可扩展物理引擎,名为Newton,预计今年晚些时候完成。Newton是一个专门为机器人学习设计的物理引擎,它专注于基于反馈的强化学习,使用可验证的物理奖励。黄仁勋在现场展示了一步由英伟达、谷歌与迪士尼合作研发,并由最新的GR00T N1模型加持的机器人Blue。黄仁勋表示,“通用机器人时代已经到来。借助英伟达Isaac GR00T N1和新的数据生成以及机器人学习框架,世界各地的机器人开发人员将开辟AI时代的下一个前沿。”图图 23:机器人基础模型机器人基础模型GROOT N1 图图 24:机器人模拟用开源、物理引擎机器人模拟用开源、物理引擎Newton 数据来源:NVIDIA 官网,广
35、发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1515/2323 Table_PageText 行业专题研究|电子 二、二、AI 模型与应用模型与应用(一)(一)AI 模型模型 1.模型结构和组成模型结构和组成 图图 25:GPT模型结构模型结构 图图 26:MOE模型模型 数据来源:CSDN,广发证券发展研究中心 数据来源:DeepSeek-V3 技术论文,广发证券发展研究中心 图图 27:GPT-3的完整工作流程的完整工作流程 数据来源:Daniel DuagsThe GPT-3 Architecture,on a N
36、apkin,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1616/2323 Table_PageText 行业专题研究|电子 表表 1:GPT-3.5模型参数符号模型参数符号 符号 含义 d 隐藏维度(Hidden Size),GPT-3.5 取值 12288 V 词汇表大小(Vocabulary Size),GPT-3.5 取值 50,257 L Transformer 层数(Number of Layers),GPT-3.5 取值 96 h 注意力头数(Number of Attention Heads),GPT-3.5 取值 96 dhead 每个注意力头中特征向
37、量的维度,GPT-3.5 取值 128 dffn FFN 层扩展维度(通常是 4d),GPT-3.5 取值 49152 T 序列长度(Sequence Length),如训练时 2048,推理时可变 B 批量大小(Batch Size)N 参数总量(Total Number of Parameters)数据来源:CSDN,广发证券发展研究中心 表表 2:GPT-3.5模型参数模型参数组成组成 组件 计算公式 每层参数量(B)总层数(L)总参数量(B)备注 嵌入层 V d+d 0.62 1 0.62 词表大小 V=50,257,隐藏维度 d=12,288 自注意力层 4d2 0.6 96 57.
38、6 包含 Q/K/V 矩阵和输出投影,d=12,288 前馈网络(FFN)8 d2 1.2 96 115.2 FFN 维度 dff=4 d=49,152 层归一化 4 d 0.00005 96 0.005 每个 Transformer 层包含 2 次层归一化(自注意力后和 FFN 后)输出层 V d 0.62 1 0.62 与嵌入层共享权重,无需额外参数 总计-1.8(每层)96 175 数据来源:CSDN,广发证券发展研究中心 2.模型发展趋势模型发展趋势 在大规模语言模型(LLM)的研究中,Scaling Law(尺度定律)描述了模型性能如何随着模型规模、训练数据量和计算资源的增加而变化。
39、具体而言,预训练Scaling Law、后训练Scaling Law和测试时Scaling Law分别关注模型在不同阶段的扩展规律。表表 3:scaling law解释解释 阶段 描述 发展趋势 预训练 Scaling Law 研究模型在预训练阶段的扩展规律。随着模型规模和训练数据量的增加,性能提升显著,但提升幅度可能逐渐减小。后训练 Scaling Law 关注模型在预训练后的微调阶段的扩展规律。增加微调数据量和计算资源可以进一步提升模型性能,尤其在特定任务上。测试时 Scaling Law 研究模型在推理阶段的扩展规律。在推理阶段增加计算资源,如延长推理时间或增加计算量,可以显著提升模型性
40、能。数据来源:CAMERON R.WOLFEScaling Laws for LLMs,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1717/2323 Table_PageText 行业专题研究|电子 图图 28:训练训练 scaling law 图图 29:推理推理 scaling law 数据来源:LifeArchitect.ai,广发证券发展研究中心 数据来源:NVIDIA 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1818/2323 Table_PageText 行业专题研究|电子 3.模型训练的并行策略模型训练的并行策略 表表
41、4:模型训练的并行策略模型训练的并行策略 并行策略 描述 优点 缺点 数据并行(DP)将训练数据划分为多个子集,每个子集在不同的设备上进行训练,每个设备拥有模型的完整副本。-简单易实现,适用于大多数模型。-每个设备需要存储完整的模型副本,显存占用较高。-能有效利用多设备的计算能力。-需要频繁的梯度同步,可能导致通信开销。张量并行(TP)将模型的单层或单个操作沿特定维度划分,分布到多个设备上进行并行计算。-适用于模型层内的并行化,能有效利用多设备的计算能力。-需要精心设计张量划分策略,避免通信瓶颈。-适用于需要处理大矩阵的模型。-实现复杂,需要处理设备间的通信。流水线并行(PP)将整个模型划分为
42、多个阶段,每个阶段包含一部分模型层,并分配到不同的设备上。-适用于模型层间的并行化,能有效利用多设备的计算能力。-需要精心设计流水线划分,避免瓶颈。-适用于层数较多的模型。-可能导致设备间的负载不均衡。专家并行(EP)将模型的不同专家(如混合专家模型中的专家)分布到不同的设备上进行并行计算。-能处理超大规模模型,减少单设备的显存占用。-需要精心设计专家划分策略,避免通信瓶颈。-适用于稀疏激活的模型。-实现复杂,需要处理设备间的通信。数据来源:CSDN,广发证券发展研究中心 4.重点厂商的模型及排行榜重点厂商的模型及排行榜 表表 5:OpenAI 主要模型信息表主要模型信息表 模型名称 发布时间
43、 参数量 核心技术 主要功能 GPT-3 2020 年 6 月 1750 亿 Transformer,自监督学习 自然语言生成、对话、翻译、代码生成等 GPT-3.5 2022 年 11 月 未公开(比 GPT-3 更小更高效)Transformer,RLHF 相较于 GPT-3 提高性能和成本效率,为 ChatGPT 提供更流畅的对话能力 GPT-4 2023 年 3 月 未公开(估计 1.8 万亿)Transformer,RLHF,CLIP(视觉理解)语言理解、代码生成、多模态(文本+图像)GPT-4 Turbo 2023 年 11 月 未公开(优化版 GPT-4)Transformer,
44、高效推理 更快、更经济的 GPT-4,适用于 OpenAI API 和 ChatGPT Sora 2024 年 2 月 未公开 扩散模型(Diffusion Models),Transformer 文本生成视频,最长 60 秒高清视频,支持多角度镜头和复杂场景 GPT-4o 2024 年 5 月 未公开 多模态(文本、图像、音频),强化视觉理解(CLIP)处理和生成文本、图像和音频,语音识别和翻译,增强的多语言和视觉能力 GPT-4o mini 2024 年 7 月 未公开 多模态(文本、图像、音频)GPT-4o 的精简版,适用于企业、初创公司和开发者的 AI 自动化服务 o1 2024 年
45、9 月 未公开 推理模型,链式思维,自我强化学习(Self-Play Reinforcement Learning),过程奖励模型(Process Reward Model)复杂推理、科学、编码任务,逐步解释逻辑推理过程,在数学和编程任务上表现卓越 o3 2024 年 12 月 未公开 推理模型,链式思维 编程和数学领域的卓越表现,特别是在真实世界软件任务评估和数学推理方面 o3-mini 2024 年 12 月 未公开 推理模型,链式思维 o3 的精简版,提供更快的推理速度和更低的成本 数据来源:OpenAI 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 1919
46、/2323 Table_PageText 行业专题研究|电子 图图 30:大语言模型公开学术榜单:大语言模型公开学术榜单 图图 31:多模态模型公开学术榜单:多模态模型公开学术榜单 数据来源:司南 OpenCompass,广发证券发展研究中心 数据来源:司南 OpenCompass,广发证券发展研究中心 5.模型对硬件需求多样化模型对硬件需求多样化 图图 32:大模型对硬件系统需求多样性大模型对硬件系统需求多样性 数据来源:meta 官网,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 2020/2323 Table_PageText 行业专题研究|电子 (二)(二)AI
47、应用应用 图图 33:AI应用应用APP访问量访问量 图图 34:AI应用应用web访问量访问量 数据来源:AI 产品榜,广发证券发展研究中心 数据来源:AI 产品榜,广发证券发展研究中心 表表 6:AI终端进展终端进展 24Q4 25Q1 25Q2 25Q3 25Q4 AI 手机手机 苹果正式上线 Apple Intelligence iPhone 17 发布 AI 汽车汽车 特斯拉在中国大陆、欧洲上线 FSD 功能 AI 眼镜眼镜 百度发布小度 AI 眼镜 小米发布 AI 眼镜 三星发布 AI 眼镜 AI PC 英特尔发布首款 AI PC 台式机处理器酷睿Ultra 200S 高通发布 S
48、napdragon X Platform 芯片;AMD 发布 Ryzen AI Max 系列 APU AIOT 火山引擎发布 AI+硬件智跃计划 数据来源:Apple 官网,Intel 官网,高通官网,VRAR 星球,IT 之家,中关村在线,53AI,广发证券发展研究中心 识别风险,发现价值 请务必阅读末页的免责声明 2121/2323 Table_PageText 行业专题研究|电子 三、投资建议三、投资建议 AI的进击时刻,Scaling law三轮驱动,AI模型和AI应用快速发展,AI硬件产业链深度受益;英伟达新品发布,推动AI产业链持续升级;DeepSeek有望引领开源生态,驱动国产A
49、I产业链蓬勃发展建议关注产业链相关标的。四、风险提示四、风险提示(一)行业周期波动风险(一)行业周期波动风险 半导体行业具有很强的周期性,市场需求受到宏观经济、下游应用等多种复杂因素影响。若市场受到周期波动影响,相关企业的经营状况可能会受到影响。(二)(二)AI行业发展不及预期行业发展不及预期 AI行业当前处于快速发展阶段,行业应用前景、技术路线等仍存在较大不确定性。若后续发展放缓或技术路线改变,则对AI处理器和内存芯片的需求有不利影响,从而影响算力芯片行业整体需求。(三)新技术进展不及预期(三)新技术进展不及预期 技术创新是半导体行业最重要的驱动力。新技术发展和推广的过程往往具有较大的不确定
50、性,受到研发投入、下游应用、市场竞争等多种因素影响。若新技术的研发、验证、推广进度不及预期,则可能对相关企业的经营状况产生影响。识别风险,发现价值 请务必阅读末页的免责声明 2222/2323 Table_PageText 行业专题研究|电子 广发电子行业研究小组广发电子行业研究小组 耿 正 :上海交通大学材料科学与工程学硕士,2020 年加入广发证券发展研究中心。王 亮 :复旦大学经济学硕士,2014 年加入广发证券发展研究中心。谢 淑 颖:厦门大学电子工程学士、上海财经大学金融硕士,2018 年加入广发证券发展研究中心。焦 鼎 :中国科学院大学博士,2022 年加入广发证券发展研究中心。张
51、 大 伟:复旦大学电子与通信工程硕士,2021 年加入广发证券发展研究中心。王 钰 乔:上海交通大学硕士,2022 年加入广发证券发展研究中心。李 佳 蔚:京都大学硕士,2022 年加入广发证券发展研究中心。广发证券广发证券行业行业投资评级投资评级说明说明 买入:预期未来12 个月内,股价表现强于大盘 10%以上。持有:预期未来12 个月内,股价相对大盘的变动幅度介于-10%+10%。卖出:预期未来12 个月内,股价表现弱于大盘 10%以上。广发证券广发证券公司投资评级说明公司投资评级说明 买入:预期未来12 个月内,股价表现强于大盘 15%以上。增持:预期未来12 个月内,股价表现强于大盘
52、5%-15%。持有:预期未来12 个月内,股价相对大盘的变动幅度介于-5%+5%。卖出:预期未来12 个月内,股价表现弱于大盘 5%以上。联系我们联系我们 广州市 深圳市 北京市 上海市 香港 地址 广州市天河区马场路26 号广发证券大厦47 楼 深圳市福田区益田路6001 号太平金融大厦 31 层 北京市西城区月坛北街 2 号月坛大厦 18层 上海市浦东新区南泉北路 429 号泰康保险大厦 37 楼 香港湾仔骆克道 81号广发大厦 27 楼 邮政编码 510627 518026 100045 200120-客服邮箱 法律主体法律主体声明声明 本报告由广发证券股份有限公司或其关联机构制作,广发
53、证券股份有限公司及其关联机构以下统称为“广发证券”。本报告的分销依据不同国家、地区的法律、法规和监管要求由广发证券于该国家或地区的具有相关合法合规经营资质的子公司/经营机构完成。广发证券股份有限公司具备中国证监会批复的证券投资咨询业务资格,接受中国证监会监管,负责本报告于中国(港澳台地区除外)的分销。广发证券(香港)经纪有限公司具备香港证监会批复的就证券提供意见(4 号牌照)的牌照,接受香港证监会监管,负责本报告于中国香港地区的分销。本报告署名研究人员所持中国证券业协会注册分析师资质信息和香港证监会批复的牌照信息已于署名研究人员姓名处披露。重要重要声明声明 广发证券股份有限公司及其关联机构可能
54、与本报告中提及的公司寻求或正在建立业务关系,因此,投资者应当考虑广发证券股份有限公司及其关联机构因可能存在的潜在利益冲突而对本报告的独立性产生影响。投资者不应仅依据本报告内容作出任何投资决策。投资者应自主作出投资决策并自行承担投资风险,任何形式的分享证券投资收益或者分担证券投资损失的书面或者口头承诺均为无效。本报告署名研究人员、联系人(以下均简称“研究人员”)针对本报告中相关公司或证券的研究分析内容,在此声明:(1)本报告的全部分析结论、研究观点均精确反映研究人员于本报告发出当日的关于相关公司或证券的所有个人观点,并不代表广发证券的立场;(2)研究人员的部分或全部的报酬无论在过去、现在还是将来
55、均不会与本报告所述特定分析结论、研究观点具有直接或间接的联系。系因此投资者应当考虑存潜利益冲突而对独性产生影响不仅依据内容 识别风险,发现价值 请务必阅读末页的免责声明 2323/2323 Table_PageText 行业专题研究|电子 研究人员制作本报告的报酬标准依据研究质量、客户评价、工作量等多种因素确定,其影响因素亦包括广发证券的整体经营收入,该等经营收入部分来源于广发证券的投资银行类业务。本报告仅面向经广发证券授权使用的客户/特定合作机构发送,不对外公开发布,只有接收人才可以使用,且对于接收人而言具有保密义务。广发证券并不因相关人员通过其他途径收到或阅读本报告而视其为广发证券的客户。
56、在特定国家或地区传播或者发布本报告可能违反当地法律,广发证券并未采取任何行动以允许于该等国家或地区传播或者分销本报告。本报告所提及证券可能不被允许在某些国家或地区内出售。请注意,投资涉及风险,证券价格可能会波动,因此投资回报可能会有所变化,过去的业绩并不保证未来的表现。本报告的内容、观点或建议并未考虑任何个别客户的具体投资目标、财务状况和特殊需求,不应被视为对特定客户关于特定证券或金融工具的投资建议。本报告发送给某客户是基于该客户被认为有能力独立评估投资风险、独立行使投资决策并独立承担相应风险。本报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性、完整性做出任何保证。报
57、告内容仅供参考,报告中的信息或所表达观点不构成所涉证券买卖的出价或询价。广发证券不对因使用本报告的内容而引致的损失承担任何责任,除非法律法规有明确规定。客户不应以本报告取代其独立判断或仅根据本报告做出决策,如有需要,应先咨询专业意见。广发证券可发出其它与本报告所载信息不一致及有不同结论的报告。本报告反映研究人员的不同观点、见解及分析方法,并不代表广发证券的立场。广发证券的销售人员、交易员或其他专业人士可能以书面或口头形式,向其客户或自营交易部门提供与本报告观点相反的市场评论或交易策略,广发证券的自营交易部门亦可能会有与本报告观点不一致,甚至相反的投资策略。报告所载资料、意见及推测仅反映研究人员
58、于发出本报告当日的判断,可随时更改且无需另行通告。广发证券或其证券研究报告业务的相关董事、高级职员、分析师和员工可能拥有本报告所提及证券的权益。在阅读本报告时,收件人应了解相关的权益披露(若有)。本研究报告可能包括和/或描述/呈列期货合约价格的事实历史信息(“信息”)。请注意此信息仅供用作组成我们的研究方法/分析中的部分论点/依据/证据,以支持我们对所述相关行业/公司的观点的结论。在任何情况下,它并不(明示或暗示)与香港证监会第 5 类受规管活动(就期货合约提供意见)有关联或构成此活动。权益披露权益披露(1)广发证券(香港)跟本研究报告所述公司在过去 12 个月内并没有任何投资银行业务的关系。版权声明版权声明 未经广发证券事先书面许可,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。