报告预览

毛航宇_强化学习(多)智能体和大语言模型(多)智能体.pdf

编号：186322

PDF 24页 961.38KB 下载积分：VIP专享

下载报告请您先登录！

毛航宇_强化学习(多)智能体和大语言模型(多)智能体.pdf

1、从强化学习(多)智能体到大语言模型(多)智能体毛航宇，快手科技2024年10月12日RLChina2024目录21.强化学习(多)智能体到大语言模型(多)智能体十年研究脉络梳理2.强化学习(多)智能体到大语言模型(多)智能体代表工作选讲Deep RL Agent(DRL)Transformer-based RL Agent(TRL)LLM-based AI Agent3.企业实践中的心得体会Background:RL AgentsBackground:AI Agentshttps:/lilianweng.github.io/posts/2023-06-23-agent/强化学习

2、(多)智能体和大语言模型(多)智能体十年研究脉络Deep RLDeep MARLNLPLLM AI AgentLLM AI Agents15DRL Foundation15-2:DQN15-2:TRPO15-6:GAE15-9:DDPG16-1:AlphaGo17-7:PPO-16CommunicationCommNet/BiCNet/ACCNetATOC/IC3Net/Gated-ACML-17Transformer-18Novel PerspectiveRainbow DQNC51/QR-DQNEvolution StrategyModel-based RLScaling RLHie

3、rarchal RL(SEIHAI)Offline RLCTDE17:MADDPG/19:ATT-MADDPG18:VDN/QMIX21:IPPO/MAPPO22:PTDEBERT-19GPT-2-20Novel PerspectiveGrouping/Role/Graph/AttentionCognition Consistency(NCC-MARL)Permutation Invariant/EquivalentGPT-3-21TRL Foundation21-6:DT/TT22-5:Generalist Agent22-12:RT-1Prompt Tuning-22MAT3-4:Inst

4、ructGPT11-30:ChatGPT-23Novel Perspective22:Prompting DT22:Online DT22:Bootstrap Tran(BooT)23:Q-learning DT23:Hierarchical DT23:TIT/PDiTMADTLlama/Llama-2GPT-3.5/GPT-423-3-23:ChatGPT plugins(OpenAI)23-6-23:LLM Powered Agents(LilLog)Github Project:AutoGPT/BabyAGI23-8-7:TPTU23-8-22:Survey from Remin Uni

5、versity23-9-14:Survey from Fudan University23-11-19:TPTU-2DS-Agent;Sheet/SQLAgent;ToolGen23:Generative Agents(斯坦福小镇)23:ChatDev/ChatEval23:AgentGen/AgentVerse23:LlaMAC24:LLM Agent Operating System24:Internet of Agents24:Automated Design of Agentic24STEERLlama-3GPT-4oO1强化学习(多)智能体和大语言模型(多)智能体十年研究脉络D

6、eep RLDeep MARLNLPLLM AI AgentLLM AI Agents15DRL Foundation15-2:DQN15-2:TRPO15-6:GAE15-9:DDPG16-1:AlphaGo17-7:PPO-16CommunicationCommNet/BiCNet/ACCNetATOC/IC3Net/Gated-ACML-17Transformer-18Novel PerspectiveRainbow DQNC51/QR-DQNEvolution StrategyModel-based RLScaling RLHierarchal RL(SEIHAI)Offline RL

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（毛航宇_强化学习(多)智能体和大语言模型(多)智能体.pdf）为本站（哆哆）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。

毛航宇_强化学习(多)智能体 和 大语言模型(多)智能体.pdf

毛航宇_强化学习(多)智能体 和 大语言模型(多)智能体.pdf

毛航宇_强化学习(多)智能体和大语言模型(多)智能体.pdf

毛航宇_强化学习(多)智能体和大语言模型(多)智能体.pdf