当前位置:首页 > 报告详情

毛宇航_RLChina23 - 周日上午 - 毛航宇 - 从 强化学习(多)智能体 到 大语言模型(多)智能体(1)_watermark.pdf

上传人: 张** 编号:155525 2024-02-15 35页 2.73MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了从多智能体强化学习到大语言模型智能体的范式转变及其关键技术。作者提出,SEIHAI是首个在NeurIPS MineRLCompetition中完全基于学习达到“铁器时代”的智能体,MineCraft成为天然演练场。研究了如何在有限通信带宽下进行多智能体通信,以及如何设置动态和静态的通信策略。同时,文章还关注了多智能体如何合作,并探究了认知一致性、任务规划和工具使用等关键问题。作者还介绍了TPTU和TPTU-V2等方法,以评估智能体在任务规划和工具使用方面的能力。最后,文章强调了原创性研究的重要性,并展望了AI在未来推动经济、社会和人类发展的潜力。
如何实现跨领域的技术融合? 如何在有限带宽下优化多智能体通信? 如何提高大语言模型在实际系统中的任务规划和工具使用能力?
客服
商务合作
小程序
服务号
折叠