当前位置:首页 > 报告详情

张驰-基于多模态大语言模型的GUI智能体.pdf

上传人: 张** 编号:182443 2024-10-14 37页 5.22MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯QQ光影实验室和西湖大学AGI实验室的研究员张驰博士,他在多模态大语言模型领域的研究成果以及将多模态模型与AIGC模型应用于GUI智能体AppAgent的研究。张驰博士的研究方向在大模型时代下的多模态模型与AIGC模型,并已在顶级会议期刊上发表多篇论文。文章还提到了AppAgent框架,该框架通过探索如何使用应用程序,并生成文档作为外部数据库,以便在决策时参考。此外,文章还提到了AppAgent框架在公司的图像编辑和3D小屋等重点业务上的应用,并展望了其未来的发展前景。
"多模态大语言模型GUI智能体有哪些应用场景?" "如何解决基于GUI的智能体在控制和感知方面的挑战?" "AppAgent框架在实际业务中如何发挥作用?"
客服
商务合作
小程序
服务号
折叠