当前位置:首页 > 报告详情

全方位评测神经网络模型的基础能力.pdf

上传人: 张** 编号:175736 2024-09-09 58页 8.94MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
张铭教授领导的团队在机器学习、图神经网络、知识图谱、推荐系统等领域有深入研究,发表学术论文300多篇,被引19200余次。他们提出了针对神经网络模型基础能力的评测数据集STEM和Social,分别涵盖K-12教育的448个技能知识点和402个技能知识点。实验结果显示,当前模型在这些基础科目上仍落后于人类。张铭教授团队还设计了MMEvalPro评测基准,通过更细粒度的评估流程与评价指标来校准多模态模型的评估过程。实验结果表明,MMEvalPro具备更大的挑战性,目前最好的LMM模型性能相较于人类性能还存在31.73%的差距。
"神经网络模型基础能力探析" "多模态STEM能力评测与挑战" "社会规范基础能力评测的重要性"
客服
商务合作
小程序
服务号
折叠