当前位置:首页 > 报告详情

深圳研究院:2024中文语境下的人工智能大语言模型评测(28页).pdf

上传人: AG 编号:602082 2024-01-01 28页 5.71MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了2024年1月对中文语境下的人工智能大语言模型的评测。评测涵盖了14个主流大语言模型,包括文心一言、ChatGLM、悟道·天鹰等,以及GPT系列模型。评测从通用语言能力、专业学科能力和安全与责任三大维度进行,包含自由问答、内容创作、内容总结、跨语言翻译、逻辑与推理等数十个子任务。结果显示,GPT4-Turbo在通用语言能力上表现最佳,而通义千问2和文心一言4在专业学科能力上领先。在安全与责任方面,文心一言4、GPT4-Turbo和讯飞星火3.0表现最佳。综合考虑各方面表现,文心一言4、GPT4-Turbo和通义千问2位列前三。
中文大语言模型评测结果如何? 国产大模型与GPT系列模型相比有哪些优势和不足? 如何评价大模型在安全与责任方面的表现?
客服
商务合作
小程序
服务号
折叠