《2025超节点在AI算力网络中的发展趋势及其对产业链的影响分析报告(31页).pdf》由会员分享,可在线阅读,更多相关《2025超节点在AI算力网络中的发展趋势及其对产业链的影响分析报告(31页).pdf(31页珍藏版)》请在三个皮匠报告上搜索。
1、行业研究市场分析深度洞察行业分析报告2025INDUSTRY REPORT 2 0 2 5 超节点在A I 算力网络中的发展趋势及其对产业链的影响分析报告 1.超节点:AI 算力网络新趋势.6 1.1 单点到系统,Scale-up、Scale-out 两维度拓展.6 1.2 英伟达:专用网络支持,单节点密度提升.8 1.3 AMD:IF128 探索超节点新路径.10 1.4 特斯拉 Dojo:专用软硬件生态或仍存掣肘.12 2.超节点掣肘?华为的解答.15 2.1 规模:模型需求与工程成本的平衡.15 2.2 华为 CM384:跨机柜超节点国产范式.18 2.3 国产 AI 算力:面向推理,适
2、配大规模 EP.22 3.产业链影响:分工细化,各环节均有增量.27 3.1 服务器:产业链分工细化.27 3.2 光通信:国产超节点方案带来光模块增量.28 3.3 铜连接:高速背板连接、铜连接仍为重要选择.30 3.4 IDC 产业链:AIDC 需求增加,液冷渗透提升.32 4.重要公司估值.32 目录 图表目录 图 1:同样为 256GPU Pod,不同组网技术导致组网效率不同.6 图 2:集群扩大有 Scale-up 和 Scale-out 两个方向.6 图 3:英伟达 NVLink Clos 拓扑.8 图 4:AMD MI300X 网状互联拓扑.8 图 5:英伟达 Scale-up
3、演进趋势:机柜算力密度大幅提升趋势.9 图 6:GB200 NVL72 为单机柜“超节点”产品.9 图 7:GB200 NVL72 拓扑72 个 B200 通过 18 个 NVSwitch 实现全互联.10 图 8:AMD Infinity Fabric 演进图.10 图 9:IF128 超节点内通过 IFoE 实现互联.11 图 10:MI450X 预计将采用 IFoE 实现 Scale-up.11 图 11:25 个 D1 Die 构成一张 Dojo Training Tile.12 图 12:6 个 Tile 加 20 张 DIP 构成 1 个 System Tray.13 图 13:1
4、 个机柜(Cabinet)包含 2 个 System Tray 和 1 个 Host.13 图 14:借助 DIP 和 TTPoE,Dojo 通过以太网形成互联.14 图 15:基于 DeepSeek R1 测算,相较于 Hopper 架构,GB300 NVL72 的性能提升显著:用户响应(单用户 TPS,横轴)提升约 10 倍,运算吞吐量(每兆瓦 TPS,纵轴)提升约 5 倍,整体性能提升达 50 倍.16 图 16:Scale up 网络规模的提升,对模型性能优化显著.16 图 17:CloudMatrix 384 为 16 机柜的“超节点”产品.18 图 18:CloudMatrix 中
5、 384 个 NPU 通过 2 层 UB Switch 实现全互联.19 图 19:通过两层 UB Switch 网络实现全互联.20 图 20:实测数据证明两层 UB Switch 互联对超节点性能影响较小.20 图 21:Decode 优化,目的是减少 EP 并行的巨大的通信开销和串行依赖.22 图 22:Prefill 优化,目的是做大吞吐,采用混合并行+微批次预填充流水线.23 图 23:Deepseek V3/R1 on 华为 CM 384.24 图 24:Deepseek V3/R1 on GB200 NVL 72.24 图 25:不同 Batchsize 对不同任务下吞吐的影响.
6、24 图 26:华为 CM384 采用 PDC 分离架构.25 图 27:Prefill 和 Decode 实例数量的比例关系示意.26 图 28:英伟达计算板卡和交换板卡设计复杂.28 图 29:CloudMatrix 384 超节点在 UB 网络的 Scale up 组网拓扑,NPU 的 400G 光模块用量比在 1:14,或者 800G 光模块的用量比在 1:7.29 图 30:华为设计 UB-Mesh 网络架构优化 LLM 训练性能.30 图 31:UB-Mesh 重点强化了 NPU 的电气电缆直接互连.31 图 32:光电混合是重要的技术趋势.31 表 1:Scale-up 和 Sc