当前位置:首页 > 报告详情

SuperCLUE:中文大模型基准测评2024年上半年报告(59页).pdf

上传人: 微*** 编号:168009 2024-07-12 59页 16.54MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,本文主要介绍了2024年上半年中文大模型的发展情况。文章指出,国内外大模型的差距进一步缩小,国内开源模型崛起,各任务表现中GPT-4o综合最佳,Claude-3.5在Hard任务表现突出,Qwen2-72B在文科任务表现优异。端侧小模型表现惊艳,部分小尺寸模型表现要好于上一代的稍大尺寸模型,极大提升了落地的可行性。文章还介绍了SuperCLUE模型象限,各维度任务目录,总榜、理科榜单、文科榜单、Hard榜单及模型象限,开源榜单及端侧小模型榜单,大模型对战胜率、成熟度指数,评测与人类一致性分析等内容。
国内外大模型差距缩小至多少? 国内开源模型表现如何? 端侧小模型有何惊艳表现?
客服
商务合作
小程序
服务号
折叠