收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于逆强化学习的示教学习方法综述

张凯峰  俞扬  
【摘要】:随着强化学习在自动机器人控制、复杂决策问题上的广泛应用,强化学习逐渐成为机器学习领域中的一大研究热点.传统强化学习算法是一种通过不断与所处环境进行自主交互并从中得到策略的学习方式.然而,大多数多步决策问题难以给出传统强化学习所需要的反馈信号.这逐渐成为强化学习在更多复杂问题中实现应用的瓶颈.逆强化学习是基于专家决策轨迹最优的假设,在马尔可夫决策过程中逆向求解反馈函数的一类算法.目前,通过将逆强化学习和传统正向强化学习相结合设计的一类示教学习算法已经在机器人控制等领域取得了一系列成果.对强化学习、逆强化学习以及示教学习方法做一定介绍,此外还介绍了逆强化学习在应用过程中所需要解决的问题以及基于逆强化学习的示教学习方法.

知网文化
【相似文献】
中国期刊全文数据库 前3条
1 陈怡帆;李欣;;基于体感交互的仿人服务机器人增强示教学习的研究[J];信息通信;2017年12期
2 丁辉;适用于模糊综合评判系统的一种机器学习方法[J];微机发展;2003年03期
3 蒋平,李自育,陈阳泉;迭代学习神经网络控制在机器人示教学习中的应用(英文)[J];控制理论与应用;2004年03期
中国博士学位论文全文数据库 前2条
1 胡晋;机械臂运动的示教学习方法与应用研究[D];浙江大学;2018年
2 金卓军;逆向增强学习和示教学习算法研究及其在智能机器人中的应用[D];浙江大学;2011年
中国硕士学位论文全文数据库 前3条
1 左思翔;基于深度强化学习的无人驾驶智能决策控制研究[D];哈尔滨工业大学;2018年
2 耿鹏;目标明确的释放型操作示教与增强学习研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2018年
3 沈珑斌;冗余灵巧臂的示教学习[D];浙江大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978