【山西证券】通信周跟踪:Stargate和DeepSeek,大模型创新和工程优化的双向奔赴-250205(17页).pdf

编号:739104 PDF 17页 1.29MB 下载积分:VIP专享
下载报告请您先登录!

【山西证券】通信周跟踪:Stargate和DeepSeek,大模型创新和工程优化的双向奔赴-250205(17页).pdf

1、请务必阅读最后股票评级说明和免责声明请务必阅读最后股票评级说明和免责声明1 1通信通信周跟踪周跟踪(20250120-20250124)领先大市领先大市-A(维持维持)Stargate 和和 DeepSeek,大模型创新和工程优化的双向奔赴,大模型创新和工程优化的双向奔赴2025 年年 2 月月 5 日日行业研究行业研究/行业周报行业周报通信通信行业近一年市场表现行业近一年市场表现资料来源:最闻相关报告:相关报告:【山证通信】山西证券通信行业周跟踪:英伟达铜光共进趋势明朗,BIS新政或不影响国内算力建设 2025.1.21【山证通信】CES 中国品牌参展数创新高,AI 端侧应用百花齐放-周跟踪

2、(20250106-20250112)2025.1.16分析师:分析师:高宇洋执业登记编码:S0760523050002邮箱:张天执业登记编码:S0760523120001邮箱:研究助理:研究助理:孙悦文邮箱:投资要点投资要点行业动向:行业动向:美国宣布美国宣布“星际之门星际之门”超算计划超算计划,Meta 也计划提升也计划提升 2025 年资本开支年资本开支。据新华社报道,美国总统特朗普 21 日宣布,将由软银集团、OpenAI、中东主权基金MGX 以及 Oracle 公司成立合资公司计划 4 年内投资 5000 亿美金建设“星际之门”超算中心。“星际之门”初始投资为 1000 亿美金,据

3、Altman 透露,OpenAI、软银、甲骨文&MGX 首期将分别注资 190 亿、190 亿、70 亿,剩余资金或由 LP 投资人或债务融资解决。另一方面,1 月 24 日据 Meta CEO 扎克伯格在 Facebook上表示,Meta 今年将投资 600 至 650 亿美金用于 AI 相关资本开支,这一数字远高于彭博社此前预计 513 亿美元的资本开支。扎克伯格表示,META 正在建设一个超过 2GW 的数据中心,计划在 2025 年上线 1GW,并在年底前拥有超过 130万 GPU。我们认为,海外 AI 和 CSP 巨头纷纷上调资本开支表明了美国政界和产业界一致希望扩大算力领先优势以巩

4、固美国在 AI 颠覆下的全球新秩序下的领导地位。目前,AI 算力投资的需求空前旺盛,这一方面来自各种 agent 智能体应用层出不穷,“AI 员工”真正渗透千行百业,另一方面来自各大云巨头害怕踏空的“AI 军备竞赛”逻辑,推理和训练双重驱动北美 2025 投资再创新高,将有效增强投资者的信心维持板块估值坚挺。国内国内 DeepSeekv3 惊艳创新,低成本实现全球领先推理大模型训练。惊艳创新,低成本实现全球领先推理大模型训练。另一方面,国内深度求索公司旗下的 DeepSeekv3 近期震撼发布,根据其技术报告分析,DeepSeekv3是一个拥有6710亿参数的MoE混合专家模型并且每个toke

5、n只有370亿参数被激活。DeepSeekv3 在 2048 个 H800 集群上只花了总共 279 万 H800 GPUHours(按照 2 美金/GPU Hour 约 558 万美金成本)完成训练,相当于成本较同等规模的 Llama3 节省了约 10 倍算力,而最终实现的效果根据海外评测各项均超越了迄今为止所有开源模型。DeepSeekv3 惊艳亮相的背后是我国 AI 工作者在算力资源有限下对系统架构和算法的极致创新,比如多头潜注意力(MLA)机制、混合专家模型(MoE)的改进以及多令牌预测。其中 MLA 利用低秩压缩和潜向量,大幅减少了长序列模型推理(尤其 CoT)对 KV 缓存的需求;

6、MoE 利用无辅助损失的负载均衡和共享专家机制攻克了路由崩溃难题;多令牌预测能够实现一次前向传递,预测多个 token 同时提高了训练和推理效率。此外,RL 阶段基于规则的奖励模型和机遇模型的奖励模型;SFT 阶段采用基于 DeepSeekR1 生产的高质量推理数据;以及数据处理方面的最小化数据冗余 FP8 低精度训练等均显著降低了算力需求。算力北美之算力北美之“大大”与国内之与国内之“精精”为何能实现双向奔赴?为何能实现双向奔赴?首先,北美模型创行业研究行业研究/行业周报行业周报请务必阅读最后股票评级说明和免责声明请务必阅读最后股票评级说明和免责声明2 2新与国内工程优化的定位不同,目前在预

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(【山西证券】通信周跟踪:Stargate和DeepSeek,大模型创新和工程优化的双向奔赴-250205(17页).pdf)为本站 (AG) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠