当前位置:首页 > 报告详情

A3--张琦--CodeArts Snap研发大模型评估探索.pdf

上传人: 张** 编号:181326 2024-08-01 29页 3.93MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了华为技术有限公司的大模型技术专家张琦,他在华为负责AI研发助手CodeArts Snap的竞争力建设和能力交付。CodeArts Snap具有8大能力,包括代码生成、智能问答、单元测试生成等。文章详细讨论了大模型评测的现状和挑战,包括评测标准落后、评测数据集覆盖度不足、评测执行自动化率不高等问题。华为提出了CoderEval,一个更加注重实际场景可用性的代码生成模型评测系统,并给出了CoderEval数据集的详细信息。文章还介绍了大模型评估流水线API网关评估系统,以及面向大模型的测试驱动开发的相关内容。最后,文章提到了华为在相关领域的专利、奖项、投资等核心业务和企业简介。
"华为CodeArts Snap如何评估模型好坏?" "大模型评测面临的挑战有哪些?" "如何构建更有效的评测体系?"
客服
商务合作
小程序
服务号
折叠