当前位置:首页 > 报告详情

中移智库:2024“弈衡”多模态大模型评测体系白皮书(29页).pdf

上传人: 人*** 编号:179615 2024-11-01 29页 1.18MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了中国移动技术能力评测中心发布的“弈衡”多模态大模型评测体系白皮书。白皮书指出,随着人工智能技术的快速发展,多模态大模型已成为全球科技革命的核心驱动力。多模态大模型在内容创作、信息检索、智能决策等多个应用场景中展现出显著优势。然而,如何对这些多模态大模型开展客观、科学的评测,评估特定任务场景下的最优选择,对大模型的研发迭代以及应用落地都具有重要意义。 白皮书提出了“弈衡”多模态大模型评测体系,该体系包含2类评测场景、4项评测要素以及6种评测维度,从功能、性能、可靠性、安全性、交互性等方面对图文大模型的图文理解能力进行全方位评测。同时,白皮书还详细介绍了“弈衡”多模态大模型评测体系的评测场景、评测要素、评测维度等关键内容。 总的来说,白皮书旨在为多模态大模型的评测场景、评测指标、评测方式等提供参考基准,为评测数据和评测工具的构建提供参考指导,推动多模态大模型产业成熟和落地应用。
弈衡多模态大模型评测体系包含哪些主要内容? 评测多模态大模型时,主要采用哪些评测方式? 构建多模态大模型评测数据时,需要遵循哪些原则?
客服
商务合作
小程序
服务号
折叠