当前位置:首页 > 报告详情

邵坤_基于(M)LLM的智能手机代理:基准测试、离线微调和在线优化.pdf

上传人: 哆哆 编号:186332 2024-11-01 28页 5.38MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,本文主要介绍了华为诺亚决策推理实验室在2023年至2024年期间,针对通用型App代理(App Agent)的研究进展。主要内容包括: 1. 华为在2023年7月推出的HarmonyOS 4引入了基于盘古大模型的小艺,集成了文本生成、知识搜索、信息概括、意图理解等功能,以打造系统级的智能体验。 2. 小米在2023年10月将大模型技术提升至集团战略层面,成为全球首个在端侧运行大模型的厂商,其初始应用场景为语音助手。 3. 2024年1月,强调了AI化系统功能的重要性,从日常功能着手,实现大模型能力的积累和深度融合。 4. 2024年1月,新系统以平台级AI为核心,引入端侧大模型,通过深度语义理解和意图识别,转变为个人助理。 5. 2024年6月,Apple提出与系统紧密结合的系统级AI,iOS原生应用的端侧AI以使用自研Siri能力为主。 6. 华为提出了一个全面的App代理评估基准,包括340个任务,涵盖中英文、系统及第三方应用、单一应用及跨应用场景。 7. 华为还提出了一种轻量级多模态App控制(LiMAC)框架,结合了AcT和微调后的VLM,能够在效率与指令理解之间取得平衡。 8. 华为还设计了一个用于分布式训练的异步可扩展强化学习微调框架(DistRL),能够在大规模手机操控数据上进行高效的RL微调。
智能体如何实现对App的全面控制? 轻量级多模态App控制框架的优势是什么? 分布式异步强化学习微调框架如何提升App智能体的性能?
客服
商务合作
小程序
服务号
折叠