【海通国际】中国电子:DeepSeek-R1能力跃升,支撑“小模型大能力”的新路径-250530(8页).pdf

编号:746751 PDF 8页 1.04MB 下载积分:VIP专享
下载报告请您先登录!

【海通国际】中国电子:DeepSeek-R1能力跃升,支撑“小模型大能力”的新路径-250530(8页).pdf

1、 Table_yejiao1 This research report is distributed by Haitong International,a global brand name for the equity research teams of Haitong International Research Limited(“HTIRL”),Haitong Securities India Private Limited(“HSIPL”),Haitong International(Japan)K.K.(“HTIJKK”),Haitong International Securiti

2、es Company Limited(“HTISCL”),and any other members within the Haitong International Securities Group of Companies(“HTISG”),each authorized to engage in securities activities in its respective jurisdiction.Please refer to the appendix for the Analyst Certification,Important Disclosures and Important

3、Disclaimer.Table_yemei1 Flash Analysis Table_summary 事件事件:2025 年 5 月 29 日,DeepSeek 在开源平台 Hugging Face 发布了其 R1 模型的最新版本DeepSeek-R1-0528。此次更新虽被官方称为“小版本试升级”,但在多个关键能力上实现了显著提升。点评点评:思维深度与推理能力大幅增强,思维深度与推理能力大幅增强,本次 R1 版本虽然基于去年 12 月发布的 DeepSeek V3 Base 模型,但通过加大后训练阶段的算力投入,显著增强了“深度思考”能力。新版模型在多个基准测试中表现出色,整体水平接近

4、OpenAI o3 与 Gemini 2.5 Pro。AIME 2025 成绩跃升成绩跃升:在高阶数学测试 AIME 2025 中,R1-0528 准确率从旧版的 70%提升至 87.5%。token 使用量翻倍使用量翻倍:平均每题思考 token 数从 12K 增加至 23K,反映出更复杂、更深入的思维路径建构。推理链蒸馏价值凸显推理链蒸馏价值凸显:R1-0528 的“思维链”被蒸馏到小模型 Qwen3-8B Base,产出 DeepSeek-R1-0528-Qwen3-8B,其在 AIME 2024 中准确率超过 Qwen3-8B(+10%),达到 Qwen3-235B 相当水平。Deep

5、Seek 团队认为,这条高质量推理链不仅对学术界的推理研究具有参考价值,也对工业界“小模型大能力”实践具有重要意义。Source:DeepSeek 新版新版 DeepSeek-R1-0528 在通用能力方面实现了全面提升。在通用能力方面实现了全面提升。首先,在改写润色、摘要生成和阅读理解等任务中,幻觉率下降了 45-50%,显著增强了输出结果的准确性与实用性;其次,模型在创意写作上也进行了优化,能够生成篇幅更长、结构更完整、风格更贴近人类偏好的议论文、小说和散文等长篇文本,写作表现更加成熟;此外,R1-0528 新增支持 Function Calling 和 JSON Output,具备函数级

6、任务调用和结构化输出能力。在 Tau-Bench 测试中,其在 airline 场景达到 53.5%、retail 场景达到 63.9%,整体表现接近 OpenAI o1-high,虽与 o3-High 和 Claude 4 Sonnet 仍有差距,但在开源模型中已属优秀水平。风险提示风险提示:1)AI 需求不及预期;2)地缘政治环境干扰供应链;3)AI 数据中心建造放缓 woTable_Title Research Report 30 May 2025 中国电子中国电子 China(Overseas)Technology DeepSeek-R1 能力跃升,支撑“小模型大能力”的新路径 Dee

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(【海通国际】中国电子:DeepSeek-R1能力跃升,支撑“小模型大能力”的新路径-250530(8页).pdf)为本站 (AG) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠