1、中 泰 证 券 研 究 所专 业 领 先 深 度 诚 信证券研究报告2 0 25.0 2.1 3DeepSeek将如何改变AI应用?分析师:闻学臣执业证书编号:S0740519090007分析师:苏仪执业证书编号:S0740520060001分析师:王雪晴执业证书编号:S0740524120003联系人:刘一哲Email:2核心观点核心观点 从从kimi(月之暗面)到智谱,从豆包(字节)到(月之暗面)到智谱,从豆包(字节)到DeepSeek,中国基础大模型一直处于快速演进之中,演进的主旋律则,中国基础大模型一直处于快速演进之中,演进的主旋律则体现为性能提升和成本降低,与计算机历史上体现为性能提
2、升和成本降低,与计算机历史上PC、互联网的发展逻辑类似。我们总结了以下三个关键词:、互联网的发展逻辑类似。我们总结了以下三个关键词:关键词关键词1:低成本:低成本。与暴力美学的大模型相对应的就是高成本,动则数百上千万元的成本投入在很大程度上制约了下游需求的释放,在中国当前的宏观环境下这种挑战更为明显。DeepSeek带来的成本指数级下降,将会大大加速AI应用的落地进程。关键词关键词2:开源:开源。伴随闭源基础大模型能力不断提升之后,是否会向上侵蚀应用市场成为了市场的一种担忧。而开源体系大大降低这种可能:1)开源体系需要生态繁荣,基模厂商与应用厂商是合作关系;2)对于应用厂商而言,开源大模型的可
3、获得性、可把握性更强,更容易基于此构建自己的垂直模型和能力。关键词关键词3:中国:中国。中国具有广阔的应用场景,但一方面接入海外OpenAI模型存在一定的障碍,另一方面中国的基础大模型能力存在差距。DeepSeek缩小了这种能力差距,一定程度上补齐了中国AI应用的底座短板。mXiUnMmOoNsOrM6MaObRnPoOsQsPeRrRnPjMmNtPbRqQuNNZpNtRxNsOoP3CONTENTS目录CCONTENTS专 业 领 先 深 度 诚 信专 业 领 先 深 度 诚 信中 泰 证 券 研 究 所中 泰 证 券 研 究 所1Big Picture:从基础模型的能力上限和应用成本谈
4、起4图表:AI应用分析框架资料来源:中泰证券研究所应用的分析框架:能力上限与应用成本共同决定应用场景应用的分析框架:能力上限与应用成本共同决定应用场景 AI随模型能力的提升和应用成本的降低,共同解锁更多应用场景。技术-能力上限曲线价格-应用成本曲线模型能力上限模型定价应用场景随模型能力提升和成本降低而不断解锁;DeepSeek的低成本+强能力将解锁更多应用场景;对话场景;智能客服;营销医疗法律AI搜索;AI代码;5图表:R1在各项任务中的表现资 料 来 源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcement Le
5、arning,中泰证券研究所图表:DeepSeek V3和其他模型的表现对比资料来源:DeepSeek-V3 Technical Report,中泰证券研究所能力上限之一:能力上限之一:DeepSeek系列模型拥有比肩系列模型拥有比肩GPT-4o、Claude3.5和和o1的能力的能力 DeepSeek V3再次展现出能力上限突破,在MMLU、MATH 500等任务中均表现除了优于GPT-4o和Claude-3.5-Sonnet的SOTA能力。其发布的推理模型DeepSeek-R1在数学、编程等推理任务中接近或达到了o1的水平。6图表:随步数提升R1-Zero的AIME任务准确度资料来源:De
6、epSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所能力上限之二:后训练阶段大规模应用强化学习,表现推理能力扩展能力上限之二:后训练阶段大规模应用强化学习,表现推理能力扩展 DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动微调+强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力涌现等)。图表:深度思考能力提升资料来源:DeepSeek-R1:Incenti