收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

分层强化学习研究综述

沈晶  顾国昌  刘海波  
【摘要】:强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但是,强化学习一直被"维数灾"问题所困扰。近年来,分层强化学习方法引入抽象(Abstraction)机制,在克服"维数灾"方面取得了显著进展。作为理论基础,本文首先介绍了强化学习的基本原理及基于半马氏过程的Q-学习算法,然后介绍了3种典型的单Agent分层强化学习方法(Option、HAM和MAXQ)的基本思想,Q-学习更新公式,概括了各方法的本质特征,并对这3种方法进行了对比分析评价。最后指出了将单Agent分层强化学习方法拓展到多Agent分层强化学习时需要解决的问题。

知网文化
【相似文献】
中国硕士学位论文全文数据库 前7条
1 刘杰;基于强化学习的多机器人围捕策略的研究[D];东北师范大学;2009年
2 张欣;基于模糊聚类的分层强化学习方法研究[D];长沙理工大学;2009年
3 周文云;强化学习维数灾问题解决方法研究[D];苏州大学;2009年
4 李立云;基于Option自动生成的分层强化学习方法研究[D];长沙理工大学;2008年
5 安岭丽;MAS中的自治协商模型优化研究[D];太原理工大学;2007年
6 付成伟;基于分层强化学习的移动机器人路径规划[D];哈尔滨工程大学;2008年
7 王军;基于分层强化学习的RoboCup 3D球队的设计与实现[D];江苏大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978