《电子行业专题研究:Deepseek R1是AGI的里程碑中长期利好算力硬件-250204(17页).pdf》由会员分享,可在线阅读,更多相关《电子行业专题研究:Deepseek R1是AGI的里程碑中长期利好算力硬件-250204(17页).pdf(17页珍藏版)》请在三个皮匠报告上搜索。
1、 Deepseek R1 是 AGI 的里程碑,中长期利好算力硬件 Table_ReportDate2025 年 2 月 4 日 请阅读最后一页免责声明及信息披露 2 证券研究报告 行业研究 行业专题研究(普通)电子电子 投资评级投资评级 看好看好 上次评级上次评级 看好看好 Table_Author 莫文宇 电子行业首席分析师 执业编号:S1500522090001 邮 箱: 信达证券股份有限公司 CINDA SECURITIES CO.,LTD 北 京 市 西 城 区 宣 武 门 西 大 街 甲127号 金 隅 大 厦B座 邮编:100031 Deepseek R1Deepseek R1
2、是是 AGIAGI 的里程碑,的里程碑,中长期利好中长期利好算力硬件算力硬件 Table_ReportDate 2025 年 2 月 4 日 本期内容提要本期内容提要:Table_Summary DeepSeek 树立里程碑,挖掘算法创新的价值潜力。树立里程碑,挖掘算法创新的价值潜力。Deepseek V3 仍是基于 Transformer 架构的模型,是一个强大的专家混合(MoE)语言模型,总共有 671B 个参数,每个令牌激活了 37B参数。DeepSeek-V3 主要贡献包括:架构层面创新的负载均衡策略和训练目标,预训练层面大幅提高训练效率,后训练层面 DeepSeek-R1 的知识提炼
3、等。DeepSeek 团队仅以 2.664M H800 GPU 小时的经济成本,在 14.8T tokens 上完成了 DeepSeek V3 的预训练。Deepseek R1 是基于是基于Deepseek V3 的架构上的集大成之作,性能对标的架构上的集大成之作,性能对标 OpenAI-o1。DeepSeek-R1-Zero 是一种通过大规模强化学习(RL)训练的模型,没有监督微调(SFT)作为初步步骤,展示了卓越的推理能力。通过强化学习,DeepSeek-R1-Zero 自然而然地出现了许多强大而有趣的推理行为。其中,DeepSeek-R1-Zero 展示了自我验证、反射和生成长CoT 等
4、功能,这标志着研究界的重要里程碑。值得注意的是,这是第一个验证的开放研究,可以纯粹通过 RL 来激励的 LLMs 推理能力,而无需 SFT。这一突破有望为该领域的未来发展铺平道路。此外,DeepSeek团队开源了 DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Qwen 和 Llama 从 DeepSeek-R1 中提炼出来的六个密集模型(1.5B、7B、8B、14B、32B、70B),在部分测试上性能超越 OpenAI o1-mini。OpenAI 掀起反攻号角,掀起反攻号角,o3-mini 和和 Deep Research 相继发布。相继发布。为了应对 DeepSeek
5、 的挑战,OpenAI 发布了 O3-mini,理解物理世界能力、编程能力大幅提升。o3-mini 在物理模拟高难度挑战中展现出惊人的实力,在模拟小球的转动时,o3-mini 具备更强的物理推理能力,而DeepSeek R1 则出现了反重力现象。此外,o3-mini 能生成四维空间内小球的弹射程序,展现出很高的潜力。此外,此外,OpanAI 还发布了还发布了 Deep Research,这是,这是 OpenAI 新发布代理新发布代理仅需一个提示,ChatGPT 将查找、分析和综合数百个在线资源,以创建研究分析师级别的综合报告。它由即将推出的 OpenAI o3 模型版本提供支持,该版本针对 W
6、eb 浏览和数据分析进行了优化,它利用推理来搜索、解释和分析互联网上的大量文本、图像和 PDF,并根据遇到的信息根据需要进行调整。AI 未来尚有星辰大海有待探索,未来尚有星辰大海有待探索,AGI 商业化奇点临近。商业化奇点临近。谷歌 DeepMind团队曾将 AI 划分为 6 大发展阶段,从狭义的层面看,在专业领域已经有 AI 模型能达到超人级别。如 AlphaFold、AlphaZero、StockFish 等AI 模型可以在特定的领域完全超越人类,但是从通用人工智能的层面看,AI 的发展还处于较低水平,如 ChatGPT 仅可以划分为 Level 1-Emerging 级别。FIGURE