当前位置:首页 > 报告详情

上海人工智能实验室:金融大模型应用评测报告-摘要版(2024).pdf

上传人: 海** 编号:490183 2025-01-20 17页 972.37KB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《金融大模型应用评测报告(2024)》摘要版,主要内容如下: 1. 评测对象:本次评测包括国内外、开闭源、通用基模与金融垂模,共计14个主流大模型机构的20个模型。 2. 评测内容与方法:基于金融垂直领域的具体需求,采用主观与客观相结合的方式,对语言大模型和多模态大模型进行全面考察,评估它们在金融场景中的表现能力。 3. 评测结果:参评模型的总分平均得分为71.9分,排名前三的模型依次为:Anthropic的Claude-3.5-Sonnet-20240620(79.8分)、阶跃星辰/财跃星辰的Step-2-16k/Finstep(79.7分)和阿里巴巴的Qwen2.5-72B-Instruct/Qwen2-VL-72B(77.6分)。 4. 评测总结:金融安全与价值对齐表现优异,但金融专业认知和多模态处理能力仍存在较大提升空间。加强高质量金融语料建设,拓展以金融业务为核心的评测框架,将成为行业引导与规范发展的重要工具。
金融大模型应用评测报告摘要版(2024)的主要内容是什么? 金融大模型在哪些方面表现优异,哪些方面存在提升空间? 金融大模型应用评测报告对行业发展有哪些重要意义?
客服
商务合作
小程序
服务号
折叠