面向开放域的大模型智能体-李鹏-YSSNLP.v2.pdf-三个皮匠报告

1、面向开放域的大模型智能体李鹏2024年6月15日YSSNLP2024YSSNLP2024YSSNLP2024 YSSNLP2024YSSNLP2024YSSNLP20242大模型智能体迅猛发展 2023年以来大模型智能体受到广泛关注，研究、框架、应用迅猛发展。https:/ et al.2023.A Survey on Large Language Model based Autonomous Agents.arXiv:2308.11432.YSSNLP2024YSSNLP2024YSSNLP2024 YSSNLP2024YSSNLP2024YSSNLP20243智能体历史沿革智能体概念由来

2、以久，是对人工智能问题的重要研究抽象。Russell,S.J.Artificial intelligence:A modern approach.Pearson Education,Inc.,2010.An agent is anything that can be viewed as perceiving its environment throughsensors and acting upon that environment through actuators.Stuart J.Russell and Peter NorvigYSSNLP2024YSSNLP2024YSSNLP2024

3、 YSSNLP2024YSSNLP2024YSSNLP20244传统智能体 v.s.大模型智能体解决开放域问题将是大模型智能体区别于传统智能体的关键特征之一。https:/deepmind.google/discover/blog/alphastar-mastering-the-real-time-strategy-game-starcraft-ii/；https:/auto-gpt.ai/训练：强化学习+自我对弈数据：专用环境收集的海量数据任务：仅能玩星际争霸2训练：免训练数据：无需专门收集数据任务：可完成多样化任务AlphaStarAutoGPTYSSNLP2024YSSNLP2024Y

4、SSNLP2024 YSSNLP2024YSSNLP2024YSSNLP20245大模型智能体现状当前大模型智能体虽获取广泛关注，但尚未完成在开放域上的效果阶跃。GPT-3ChatGPT大模型智能体潜力初现效果阶跃通用性自主性有效性YSSNLP2024YSSNLP2024YSSNLP2024 YSSNLP2024YSSNLP2024YSSNLP20246典型系统1：OpenAI GPTs 基础版：使用文字配置智能体，可看作系统提示的产品化。进阶版：基础版+工具调用，增加了一定自主性。图片来源：https:/ YSSNLP2024YSSNLP2024YSSNLP20247典型系统2：斯坦

5、福小镇可以一定程度实现人类行为的模拟，并观察到涌现行为。目前尚无法胜任大规模人类行为的模拟，模拟可信性也仍需提高。Park et al.,2023.Generative Agents:Interactive Simulacra of Human Behavior.UIST 23.通用性自主性有效性YSSNLP2024YSSNLP2024YSSNLP2024 YSSNLP2024YSSNLP2024YSSNLP20248典型系统3：AI化学家Coscientist 可实际操作特定实验设备完成需要复杂合成步骤的化合物合成。专用系统：智能体在部分环节可以使用搜索引擎，但所有步骤均由人类设计。Boi

6、ko et al.,2023.Autonomous Chemical Research with Large Language Models.Nature.通用性自主性有效性YSSNLP2024YSSNLP2024YSSNLP2024 YSSNLP2024YSSNLP2024YSSNLP20249大模型智能体系统现状小结当前智能体仍处于发展的初级阶段，距离开放域理想系统仍然具有很大差距。典型系统通用性自主性有效性OpenAI GPTsAI化学家斯坦福小镇AutoGPT/MetaGPTVoyager开放域理想智能体YSSNLP2024YSSNLP2024YSSNLP2024 YSSNLP202

面向开放域的大模型智能体-李鹏-YSSNLP.v2.pdf

相关报告