《电子元器件行业:DeepSeek~V3.2~Exp发布国产算力需求加速增长-251004(4页).pdf》由会员分享,可在线阅读,更多相关《电子元器件行业:DeepSeek~V3.2~Exp发布国产算力需求加速增长-251004(4页).pdf(4页珍藏版)》请在三个皮匠报告上搜索。
1、 请务必阅读正文之后的免责条款部分 股票研究股票研究 行业跟踪报告行业跟踪报告 证券研究报告证券研究报告 股票研究/Table_Date 2025.10.04 DeepSeek-V3.2-Exp 发布,国产算力需求加速增长发布,国产算力需求加速增长 Table_Industry 电子元器件电子元器件 Table_Invest 评级:评级:增持增持 Table_Report 相关报告相关报告 电子元器件华为发布全新超节点,国产算力再加速2025.09.20 电子元器件商务部发起模拟 IC 反倾销调查,国产替代加速2025.09.14 电子元器件海光开放互联总线,国产算力生态加速统一2025.09
2、.14 电子元器件下一代英伟达 Rubin CPX 内存升级2025.09.11 电子元器件中芯国际拟发行 A 股购买中芯北方49%少数股权2025.08.31 table_Authors 姓名 电话 邮箱 登记编号 舒迪(分析师)021-38676666 S0880521070002 段笑南(研究助理)021-38031382 S0880124070028 本报告导读:本报告导读:DeepSeek-V3.2-Exp 发布,性能不变前提下发布,性能不变前提下 API 费用大幅下调费用大幅下调,国产算力需求加速,国产算力需求加速增长。增长。投资要点:投资要点:Table_Summary 投资建议
3、。投资建议。根据 DeepSeek 公众号,其于 2025 年 9 月 29 日正式发布 DeepSeek-V3.2-Exp 模型。该模型引入 DSA 机制,在保持性能基本不变的前提下大幅降低 API 成本。我们认为或将加速国产 AI 应用渗透,加快国产算力需求增长。推荐标的:寒武纪-U、海光信息、中芯国际、兆易创新、盛科通信-U,相关标的:芯原股份。DeepSeek-V3.2-Exp 引入引入 DSA 机制,机制,API 费用大幅下调。费用大幅下调。根据DeepSeek 公众号,其于 2025 年 9 月 29 日正式发布 DeepSeek-V3.2-Exp 模型。该模型在 V3.1-Ter
4、minus 的基础上引入 DeepSeek Sparse Attention,针对长文本的训练和推理效率进行优化与验证。其(1)DeepSeek Sparse Attention 首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果前提下实现长文本训练和推理效率大幅提高。并且在各领域公开评测集中,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平;(2)新模型服务成本大幅降低,API 价格亦大幅下调。输入(缓存命中)价格由 0.5 元/百万 tokens 降至 0.2 元/百万 tokens,输出价格由 12 元/百万 tokens 降至 3 元/百万 tok
5、ens。我们认为,DeepSeek 通过引入 DSA 机制,在保持性能基本不变的前提下大幅降低 API 成本,将有效加速国产 AI 应用渗透,加快算力需求增长。国产算力芯片国产算力芯片实现实现 Day 0 适配适配,软硬一体加速国产替代。,软硬一体加速国产替代。根据寒武纪公众号,其已同步实现对 DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎 vLLM-MLU 源代码。针对本次新模型架构,寒武纪通过 Triton 算子开发实现快速适配,利用 BangC 融合算子开发实现极致性能优化,并基于计算与通信的并行策略,达成业界领先的计算效率水平。根据华为计算公众号,昇腾在 DeepSe
6、ek-V3.2-Exp 一发布开源即实现 DeepSeek-V3.2-Exp BF16 模型部署,并在 CANN 平台上完成对应的优化适配。针对稀疏 DSA 结构,叠加实现长序列亲和的 CP 并行策略,兼顾时延和吞吐,在 128K 长序列下能够保持TTFT 低于 2 秒、TPOT 低于 30 毫秒的推理生成速度。我们认为寒武纪与昇腾针对 DeepSeek-V3.2-Exp 的 Day 0 适配,表明国产算力芯片在性能及软件生态建设方面加速完善,未来或可应用至国产训练场景中。催化剂。催化剂。基于国产算力芯片的一流 AI 大模型发布;国产高性能 AI应用发布。风险提示。风险提示。先进制程产能扩产进