《【海通国际】中国电子:DeepSeek-R1能力跃升,支撑“小模型大能力”的新路径-250530(8页).pdf》由会员分享,可在线阅读,更多相关《【海通国际】中国电子:DeepSeek-R1能力跃升,支撑“小模型大能力”的新路径-250530(8页).pdf(8页珍藏版)》请在三个皮匠报告上搜索。
1、 Table_yejiao1 This research report is distributed by Haitong International,a global brand name for the equity research teams of Haitong International Research Limited(“HTIRL”),Haitong Securities India Private Limited(“HSIPL”),Haitong International(Japan)K.K.(“HTIJKK”),Haitong International Securiti
2、es Company Limited(“HTISCL”),and any other members within the Haitong International Securities Group of Companies(“HTISG”),each authorized to engage in securities activities in its respective jurisdiction.Please refer to the appendix for the Analyst Certification,Important Disclosures and Important
3、Disclaimer.Table_yemei1 Flash Analysis Table_summary 事件事件:2025 年 5 月 29 日,DeepSeek 在开源平台 Hugging Face 发布了其 R1 模型的最新版本DeepSeek-R1-0528。此次更新虽被官方称为“小版本试升级”,但在多个关键能力上实现了显著提升。点评点评:思维深度与推理能力大幅增强,思维深度与推理能力大幅增强,本次 R1 版本虽然基于去年 12 月发布的 DeepSeek V3 Base 模型,但通过加大后训练阶段的算力投入,显著增强了“深度思考”能力。新版模型在多个基准测试中表现出色,整体水平接近
4、OpenAI o3 与 Gemini 2.5 Pro。AIME 2025 成绩跃升成绩跃升:在高阶数学测试 AIME 2025 中,R1-0528 准确率从旧版的 70%提升至 87.5%。token 使用量翻倍使用量翻倍:平均每题思考 token 数从 12K 增加至 23K,反映出更复杂、更深入的思维路径建构。推理链蒸馏价值凸显推理链蒸馏价值凸显:R1-0528 的“思维链”被蒸馏到小模型 Qwen3-8B Base,产出 DeepSeek-R1-0528-Qwen3-8B,其在 AIME 2024 中准确率超过 Qwen3-8B(+10%),达到 Qwen3-235B 相当水平。Deep
5、Seek 团队认为,这条高质量推理链不仅对学术界的推理研究具有参考价值,也对工业界“小模型大能力”实践具有重要意义。Source:DeepSeek 新版新版 DeepSeek-R1-0528 在通用能力方面实现了全面提升。在通用能力方面实现了全面提升。首先,在改写润色、摘要生成和阅读理解等任务中,幻觉率下降了 45-50%,显著增强了输出结果的准确性与实用性;其次,模型在创意写作上也进行了优化,能够生成篇幅更长、结构更完整、风格更贴近人类偏好的议论文、小说和散文等长篇文本,写作表现更加成熟;此外,R1-0528 新增支持 Function Calling 和 JSON Output,具备函数级
6、任务调用和结构化输出能力。在 Tau-Bench 测试中,其在 airline 场景达到 53.5%、retail 场景达到 63.9%,整体表现接近 OpenAI o1-high,虽与 o3-High 和 Claude 4 Sonnet 仍有差距,但在开源模型中已属优秀水平。风险提示风险提示:1)AI 需求不及预期;2)地缘政治环境干扰供应链;3)AI 数据中心建造放缓 woTable_Title Research Report 30 May 2025 中国电子中国电子 China(Overseas)Technology DeepSeek-R1 能力跃升,支撑“小模型大能力”的新路径 Dee