当前位置:首页 > 报告详情

多环境下的 LLM Agent 应用与增强.pdf

上传人: 张** 编号:175727 2024-09-09 81页 62.35MB

1、多环境下的LLM Agents 应与增强演讲:刘邦蒙特利尔学&Mila研究所 助理教授 Canada CIFAR AI Chair1CONTENTS录01模型与智能体02多模具身智能体03推理密集智能体04科学领域智能体2LLM and Agents01它的定义,框架,与挑战3什么是Agent?Give me the definition of Agent.4Agent的定义Give me the definition of Agent.“An agent is anything that can be viewed as perceiving its environment through

2、sensors and acting upon that environment through actuators.Stuart J.Russell and Peter Norvig”5简之。Give me the definition of Agent.“An agent is a system that can help complete tasks intelligently.”6Just Do ItBut how?We need tools7Just Say ItBut how?We need toolsTools as subagents of an agent system8幕后

3、主脑But how?We need toolsTools as subagents of an agent systemWe need LLM9languagelanguagemachineunderstanding(NLU)generation(NLG)基于LLM的然语处理 LLMEnvToolsPerceptionAction10Agent系统框架World ModelWorldMemoryCostSensorActorBackbonePerceptInputOutputActResponseThinkErrorPredictInputReadWriteReadQueryFeedbackD

4、ynamic environment stateStaticdataUserInputsErrorWrite11些现存的 AgentsMobile ALOHAAI ScientistAlpha GeometryCradleGPT-4VGPT-3.5DeepMind SIMAGenerativeAgentsVoyagerThinkThriceM3AWith AndroidWorldAndroidControlAgentData InterpreterOPExM3AWith AndroidWorldThinkThriceAgents的分类13CognitionPerceptionActionGPT

5、-3.5GenerativeAgentsMobile ALOHAOPExAlpha GeometryCradleDeepMind SIMAGPT-4VData InterpreterVoyagerLLM Agent的些核挑战14World ModelWorldMemoryCostSensorActorBackbonePerceptInputOutputActResponseThinkErrorPredictInputReadWriteReadQueryFeedbackDynamic environment stateStaticdataUserInputsErrorWriteHow to re

6、present and align multimodal input signals?How to achieve real-time perception in dynamic settings?How can agents handle incomplete or noisy data robustly?How to perform complex tasks?How to deal with unseen tasks?How to learn and utilize domain knowledge?How to effectively execute actions?How to se

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,本文主要介绍了多环境下的LLM Agents应用与增强。主要内容包括: 1. LLM和Agent的定义、框架与挑战。 2. 介绍了什么是Agent,并给出了定义。 3. 探讨了多模态感知和动作执行在LLM具身智能体中的瓶颈。 4. 构造新型多模态任务(如VCR)有助于提高多模态表示学习。 5. 对问题的多重思考检验有助于提高推理准确性和减少幻觉。 6. 剧本杀任务可以成为推理评测任务。 7. 通过自动构造大量高质量数据集有助于提高领域内专业知识的获取。 8. 通过化繁为简,层次图管理,复用经验的方式可以提高复杂任务的成功率。 9. 构造高质量的工具集能大大拓展智能体的能力。 10. 工具集应动态构造和优化累积。 11. 高质量的经验池也能明显提高解决复杂任务的能
大模型智能体如何应对多环境挑战? 推理密集型智能体如何提高推理准确性? 科学领域智能体如何获取和利用专业知识?
客服
商务合作
小程序
服务号
折叠