《【德邦证券】通信行业周报:DeepSeek打破scaling law,国产基础设施打造价值网络-250222(17页).pdf》由会员分享,可在线阅读,更多相关《【德邦证券】通信行业周报:DeepSeek打破scaling law,国产基础设施打造价值网络-250222(17页).pdf(17页珍藏版)》请在三个皮匠报告上搜索。
1、 请务必阅读正文之后的信息披露和法律声明 Table_Main 证券研究报告|行业周报 通信 2025 年 02 月 22 日 通信通信 优于大市(维持)优于大市(维持)证券分析师证券分析师 李宏涛李宏涛 资格编号:S0120524070003 邮箱: 研究助理研究助理 市场表现市场表现 资料来源:德邦研究所,聚源数据 相关研究相关研究 1.DeepSeek 加速基础设施和商业模式成熟,2025.2.15 2.DeepSeek 快速渗透,商业模式优势加速基础设施爆发,2025.2.8 3.DeepSeek,中国算力模式胜出的加速器,2025.2.5 4.AI 基础设施助推“玩具场景”,C 端应
2、用或将放量,2025.1.25 5.台积电入场,光引擎进入芯片时代?,2025.1.22 DeepSeek 打破打破 scaling law,国产基,国产基础设施打造价值网络础设施打造价值网络 Table_Summary 投资要点:投资要点:1.投资策略投资策略 1.1 PTX 改写改写 scaling law,蒸馏加速行业模型建立。,蒸馏加速行业模型建立。Scaling Law 是研究模型性能发展的重要理论工具,传统思路上是数据量、模型规模一定时通过增加算力规模来获取更优秀的模型性能。DeepSeek 则通过更优秀的模型优化手段使模型性能对算力规模的敏感度增加从而在更低的算力规模实现了更优秀
3、的模型性能。我们认为DeepSeek 通过 PTX 语言的深度优化极大程度上改写了行业对于 Scaling Law 的传统理解。结合其开源背景,或将推动产业链降低对高端算力、大规模集群的需求,降低算力准入门槛从而吸引更多参与者。国产算力链条或迎来机会。1、PTX 优化改变 Scaling law 思路,降低高端算力芯片、大规模集群需求。DeepSeek 通过CUDA 底层汇编语言(PTX)进行优化,极大程度上提升了模型训练、推理的能效比。Janus-Pro 1B 模型仅通过 128 颗 A100 训练一周。DeepSeek-V3 总训练成本仅为 557 万美元,GPT-4o 训练成本约为 1
4、亿美元。2、基座模型蒸馏得到优秀小模型。DeepSeek 通过对 DeepSeek-R1 蒸馏得到了基于开源模型 Qwen 和 Llama的多个密集模型并取得对标 OpenAI o1-mini 的性能。理论上其他模型也可以通过蒸馏的方式实现快速的能力提升。3、云厂商部署齐备。八大国产云厂商已经分别宣布上线 DeepSeek 系列模型。同时海外科技厂商包括亚马逊 AWS、微软 Azure、英伟达等也已经宣布接入 DeepSeek 模型。1.2 用户、流量向算力需求转化,用户、流量向算力需求转化,AIDC 需求上行。需求上行。DeepSeek 发布以来用户数量激增,数据流量对超出公司承载范围,算力
5、需求外溢。我们认为,DeepSeek 或仍然有进步空间,即训练的算力需求并未消失。同时 C 端和 B 端的表现,推理端的算力需求已经初现端倪。未来或对算力规模增长起到进一步促进作用。1、ToC 端需求旺盛。DeepSeek 2025 年 1 月 11 日上线 App 后,仅用 20 天就成为国内日活跃用户最多的 AI 对话类 App。数据分析平台 QuestMobile 最新数据显示,DeepSeek App 从上线以来至 2 月 9 日,累计下载量超 1.1 亿次,周活跃用户规模最高近 9700 万。2 月 3 日-2 月 9 日日均活跃用户数达 3780 万。2、ToB 端需求溢出。根据
6、DeepSeek 官网 API 页面公司服务器资源紧张,当前已经停止 API 充值服务。3、第三方厂商替补接力。由于 DeepSeek 开源,多家厂商已经接入“满血”DeepSeek 模型,包括百度搜索、腾讯元宝、企业微信等。1.3 坚持开源分享策略,技术及数据平权加速行业落地。坚持开源分享策略,技术及数据平权加速行业落地。DeepSeek 宣布将开源 5个代码库(在线服务中的基础组件)。我们认为结合 DeepSeek 本身的模型、技术开源,或上将极大程度促进各行业模型的发展及落地,将推动“AI 赋能千行百业”理念的迅速发展。1、坚持贯彻开源策略。2 月 21 日,DeepSeek 宣布,将开