《资讯科技行业大模型深度:DeepSeek带来互联网新格局-250215(23页).pdf》由会员分享,可在线阅读,更多相关《资讯科技行业大模型深度:DeepSeek带来互联网新格局-250215(23页).pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、海外行业深度报告|资讯科技业 证券研究报告 请阅读最后评级说明和重要声明 1/23 行业评级 推荐(维持)报告日期 2025 年 02 月 15 日 相关研究相关研究 【兴证海外 TMT】AI 手机深度:智能机迈入 2.0 时代-2024.11.22【兴证海外 TMT】中概互联网 2024 年中期投资策略:核心资产的再次修复-2024.07.12【兴证海外 TMT】AI 手机深度:智能机迈入 2.0 时代-2024.11.22【兴证海外 TMT】中概互联网 2024 年中期投资策略:核心资产的再次修复-2024.07.12 分析师:洪嘉骏分析师:洪嘉骏 S0190519080002 BPL82
2、9 S0190519080002 BPL829 分析师:翁嘉源分析师:翁嘉源 S0190523060002 请注意:翁嘉源并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管的活动。 S0190523060002 请注意:翁嘉源并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管的活动。 大模型深度:大模型深度:DeepSeekDeepSeek 带来互联网新格局带来互联网新格局 投资要点:投资要点:DeepSeekDeepSeek 之前:预训练是模型能力提升的主要路径。之前:预训练是模型能力提升的主要路径。模型训练通常分为两个主要阶段:预训练和后训练,此前行业中,预
3、训练阶段消耗的资源远远超过后训练阶段。而模型预训练阶段的能力提升 主要依赖于两个关键因素的增强:一是强大的训练算力,二是海量且高质量的数据。模型训练通常分为两个主要阶段:预训练和后训练,此前行业中,预训练阶段消耗的资源远远超过后训练阶段。而模型预训练阶段的能力提升 主要依赖于两个关键因素的增强:一是强大的训练算力,二是海量且高质量的数据。DeepSeekDeepSeek 的意义在于指明了强化学习的正确路径。的意义在于指明了强化学习的正确路径。2024 年 9 月 OpenAI 推出ChatGPT-o1,该模型发现在后训练中用强化学习在足够强的模型上进行训练,能够使得模型学会推理,并在模型能力上
4、有明显提升。但o1 闭源使得行业复现难度大。而DeepSeek-R1 在 2025 年 1 月发布后,将“强化学习”的方式与推理模型 R1 进行开2024 年 9 月 OpenAI 推出ChatGPT-o1,该模型发现在后训练中用强化学习在足够强的模型上进行训练,能够使得模型学会推理,并在模型能力上有明显提升。但o1 闭源使得行业复现难度大。而DeepSeek-R1 在 2025 年 1 月发布后,将“强化学习”的方式与推理模型 R1 进行开源,真正意义上实现了“技术平权”。源,真正意义上实现了“技术平权”。训练模型以提升其能力出现了一条更具性价比的路径。训练模型以提升其能力出现了一条更具性价
5、比的路径。虽 DeepSeek 并未披露其 R1 强化学习阶段的成本,但如论文AI capabilities can be significantly improved withoutexpensive retraining 所论述:“后训练阶段的开发成本投入相对较低,微调成本通常小于原始训练成本的 1%,但即使这样,也能显著增强模型能力。”虽 DeepSeek 并未披露其 R1 强化学习阶段的成本,但如论文AI capabilities can be significantly improved withoutexpensive retraining 所论述:“后训练阶段的开发成本投入相对较
6、低,微调成本通常小于原始训练成本的 1%,但即使这样,也能显著增强模型能力。”DeepSeekDeepSeek 到来的思考:到来的思考:思考一:大模型差距大幅度缩短,模型能力将迎来一轮新爆发。思考一:大模型差距大幅度缩短,模型能力将迎来一轮新爆发。新范式后,预新范式后,预训练不是厂商“All in AI”的唯一解。对于 AI 的后发者,加大强化学习的资金投入成了性价比更高的路径。训练不是厂商“All in AI”的唯一解。对于 AI 的后发者,加大强化学习的资金投入成了性价比更高的路径。思考二:思考二:ChatbotChatbot 的入口之争将更加激烈。的入口之争将更加激烈。推理模型的到来让