当前位置:首页 > 报告详情

22强化学习专题论坛.pdf

上传人: 会*** 编号:111448 2023-01-03 67页 4.36MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了基于模型的深度强化学习(Model-Based Reinforcement Learning,MBRL)算法的研究背景、发展历程、主要算法及其应用。首先,作者对比了无模型强化学习(Model-Free Reinforcement Learning,MFRL)和有模型强化学习(MBRL)的特点,指出MBRL在数据采样效率上的优势。接着,作者详细介绍了基于黑盒模型的Dyna算法、Shooting methods(基于随机采样的MPC算法)、MBPO算法及其理论分析与实现方法。最后,作者介绍了最新的BMPO算法理论分析与实现方法,并总结了MBRL的发展趋势和未来挑战。
深度强化学习如何提高数据采样效率? Dyna算法如何结合Q-Learning提升策略性能? BMPO算法相比MBPO有哪些优势?
客服
商务合作
小程序
服务号
折叠