《新华社研究院:2023人工智能大模型体验报告2.0(27页).pdf》由会员分享,可在线阅读,更多相关《新华社研究院:2023人工智能大模型体验报告2.0(27页).pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、1中国企业发展研究中新华社国家端智库分中人工智能大模型体验报告2.0新华社研究院中国企业发展研究中心2023年08月2报告综述在2023年6月首次发布的人工智能大模型体验报告基础之上,本次测评在题目设计、对标Benchmark(人类)、打分权重、专家测评团队四大维度进行了全面升级。在题目设计方面,测评题目由300道扩展至500道,并进一步完善了题目分类;在对标Benchmark方面,本次测评将接受过高等教育的人类作为对照,来考评大模型真实能力;在打分标准上,本次测评根据对产业、生活的实际价值,对四大测评维度进行了权重设计;在测评团队方面,本次测评特邀北京大学文化与传播研究所及其他业界、学界专家
2、全程参与。通过本次测评发现,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。具体来看,科大讯飞的星火在工作提效方面优势明显;百度文心一言地基深厚、基础能力仍处领军水准;商汤商量则在情商方面表现优秀;智谱AI 的ChatGLM整体表现优秀。在本次体验测评的基础上,研究团队将继续深耕,加强在大模型安全可解释性、工作提效能力、实际落地情况、产业优秀案例等维度上的探索与研究,欢迎持续关注。3目录2.0版本大模型综合指数2.0版本测评细分维度指数及评述大模型市场综述大模型厂商整体测评2.0版本厂商优秀答案展示目 录020103大
3、模型发展进程大模型应用发展建议大模型未来发展趋势2.0版本大模型测评规则大模型2.0版本测评题目展示401.大模型成为AI大规模落地拐点5大模型发展进程中国大模型发展现状中国大模型发展热度依旧,天眼查数据显示,截至2023年上半年,与“大模型”直接相关的融资事件超20起,其中包含光年之外、面壁智能等明星级创业企业;从被投企业的地域分布来看,北京、上海以及杭州位居前列,特别是北京,融资事件数量超10起,凸显出北京在人工智能领域的领先地位。越来越多的企业和学术界开始关注如何将大模型与实际应用场景相结合,实现真正的商业化应用。具体来说探索主要围绕研究层面和应用层面:研究层面,中国大模型在科研方面已形
4、成涵盖理论、方法、软硬件的体系化能力,学术界和产业界共同参与,形成更加完善的理论框架。应用层面,目前大模型已开始渗透到各行各业,实现商业化应用。超过半数的大模型实现开源。大模型发展进程360智脑-360WAI-微盟WPS AI-金山办公超拟人大模型-聆心智能赤兔-容联运混元-腾讯九天-中国移动源-浪潮盘古-华为日日新-商汤天工-昆仑万维天书-云天励飞通义千问-阿里云文心一言-百度西湖-西湖心辰星河-中国电信星火-科大讯飞序列猴子-出门问问玉颜、丹青-网易伏羲知海图-知乎紫东太初-中科院通用大模型应用垂直大模型应用-教育-子曰-有道-金融-ChatABC-中农行-媒体-Baker-GPT-标贝科
5、技Graph-AIGC-图宇宙-汽车-DriveGPT-毫末智行-医疗-HealthGPT-叮当medGPT-医联左医GPT-左手医生-游戏-DRL-rct AIGAEA-超参数6大模型应用发展建议大模型进程过半,如何让AI真正走进千家万户成关注重点降低成本优化算法:通过改进和优化算法,可以降低模型的计算复杂度,减少所需的计算资源和时间。分布式训练:分布式训练是一种技术,可以将训练任务分配到多个计算节点上并行处理,从而加速训练过程。模型压缩:通过减少模型的参数数量、裁剪模型的结构或使用低精度计算等方法,来减小模型的存储空间和计算复杂度。AI技术发展的重点已经从大模型的盲目追求转向了实用性和可持
6、续性的发展,AI大规模落地需要更多时间来验证。通过降低成本、提高易用性、增强可靠性、保护隐私和安全等方面的措施,可以进一步提高大模型的可用性,让更多的人受益于AI技术的发展,实现更加智能化和便捷化的生活。提高易用性用户界面设计:设计直观、易用的用户界面,利用自然语言交互等技术,降低使用门槛。开发工具和平台:提供简单易用的开发工具和平台,例如智能代码生成、自动化模型训练等工具,使非专业人士也能够轻松上手。服务支持:提供相关的培训和教育资源,帮助用户了解AI技术的原理和应用场景,加强运营和推广,形成数据-技术-用户-数据反馈的正向闭环。安全可解释提升数据质量:提高数据的质量和多样性,加强对数据的清