当前位置:首页 > 报告详情

SuperCLUE:中文大模型基准测评2025年3月报告(46页).pdf

上传人: 破*** 编号:618613 2025-03-20 46页 20.56MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了2025年3月SuperCLUE团队发布的中文大模型基准测评报告。报告内容包括2025年度关键进展及趋势、年度通用测评介绍、总体测评结果与分析、DeepSeek系列模型深度分析等。报告指出,2025年大模型在国内外差距正在缩小,国内头部模型如DeepSeek-R1、QwQ-32B等在关键能力维度上已能与国际领先模型媲美,甚至在某些领域实现超越。报告还指出,推理模型在总榜和推理任务榜单上的得分差距较大,其中DeepSeek-R1在数学推理和代码生成任务上得分均超过80分,但在科学推理上则相对薄弱。此外,报告还分析了DeepSeek-R1在第三方平台上的联网搜索能力和稳定性表现。
2025年中文大模型有哪些关键进展? DeepSeek-R1与国内外推理模型相比有哪些优势? SuperCLUE基准测评如何评估大模型?
客服
商务合作
小程序
服务号
折叠