1、中 泰 证 券 研 究 所专 业 领 先 深 度 诚 信证券研究报告2 0 25.0 3.1 3DeepSeek银行部署加速,AI金融应用迎来跃迁分析师:闻学臣执业证书编号:S0740519090007分析师:苏仪执业证书编号:S0740520060001分析师:王雪晴执业证书编号:S0740524120003联系人:蒋丹Email:2核心观点核心观点 DeepSeek开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本。其通过对训练方式、算法架构和推理方法的工程化优化大幅降低了部署成本。近期采用大规模RL训练方法的阿里QwQ-3
2、2B等模型也在缩小规模的同时达到了DeepSeek R1 671B的应用效果,有望进一步催生银行落地应用。我们认为金融行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能我们认为金融行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能。在实际银行落地应用中,可能包括:1)降本增效:智能客服、信贷审批、合同质检;2)价值创造:AI编程、智能风控、智能营销等;3)决策赋能:深度分析和决策辅助。从实际落地应用情况看,大行发力更早,中小银行正在快速追赶从实际落地应用情况看,大行发力更早,中小银行正在快速追赶。如工商银行、建设银行、招商银行等大行布局更早,邮储银行
3、、浦发银行、江苏银行等也有较为领先布局应用。AI一体机的出现为机构提供了全新的解决方案,凭借其开箱即用、软硬件一体化设计等优势,正在成为很多中小银行智能化转型的重要选择。建议关注建议关注:宇信科技、京北方、天阳科技、长亮科技、百融云等。风险提示风险提示:AI技术落地不及预期、竞争加剧、信息更新不及时等。NBnZoOsNzRvMqNsMaQaO9PoMpPpNsPlOoOsRfQnMpQ7NrRzQMYmMuMvPoOqN3CONTENTS目录CCONTENTS专 业 领 先 深 度 诚 信专 业 领 先 深 度 诚 信中 泰 证 券 研 究 所中 泰 证 券 研 究 所1DeepSeek开源、
4、低成本、强推理助推银行业应用4图表:随步数提升R1-Zero的AIME任务准确度资料来源:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所性能:后训练阶段大规模应用强化学习,表现推理能力扩展性能:后训练阶段大规模应用强化学习,表现推理能力扩展 DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动+大规模强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力
5、涌现等)。图表:深度思考能力提升资料来源:DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所DeepSeek-R1-Zero的能力随步数提升DeepSeek-R1-Zero自然涌现long-CoT能力5图表:DeepSeek R1架构图资料来源:DeepSeek,中泰证券研究所性能:性能:DeepSeek推理架构优化,可适配银行高并行、高响应的业务场景推理架构优化,可适配银行高并行、高响应的业务场景 DeepSeek通过优化训练方法显著降低了算力消耗,使其在大规模数据
6、处理中的成本更具优势通过优化训练方法显著降低了算力消耗,使其在大规模数据处理中的成本更具优势。它在MoE架构的基础上,通过多头潜注意力机制(Multi-Head Latent Attention,MLA)进行优化;在后训练阶段采用冷启动+大规模强化学习方式,不再使用传统SFT做大规模监督微调,甚至绕过了一些CUDA,采用PTX汇编来提升能力;在推理场景下通过大规模跨节点专家并行(Expert Parallelism,EP)来优化通信开销,尽可能实现负载均衡。图表:DeepSeek R1训练方法资料来源:木尧,中泰证券研究所6图表:DeepSeek DAU快速增长资料来源:AI产品榜,中泰证券研