强化学习原理、算法及应用
【摘要】:强化学习(ReinforcementLearningRL)是从动物学习理论发展而来的,它不需要有先验知识,通过不断与环境交互来获得知识,自主的进行动作选择,具有自主学习能力,在自主机器人行为学习中受到广泛重视.本文综述了强化学习的基本原理,各种算法,包括TD算法、Q-学习和R学习等,最后介绍了强化学习的应用及其在多机器人系统中的研究热点问题.
|
|
|
|
1 |
俞星星,阎平凡;强化学习系统及其基于可靠度最优的学习算法[J];信息与控制;1997年05期 |
2 |
马莉,蔡自兴;基于强化学习的模糊自适应控制器[J];中南工业大学学报(自然科学版);1998年02期 |
3 |
张汝波,周宁,顾国昌,张国印;基于强化学习的智能机器人避碰方法研究[J];机器人;1999年03期 |
4 |
张健沛,王醒策,张岩,张汝波,温丽华;连续动作强化学习及其在机器人中的应用研究[J];哈尔滨工程大学学报;2000年03期 |
5 |
周锐,陈宗基;强化学习在导弹制导中的应用[J];控制理论与应用;2001年05期 |
6 |
王醒策,张汝波,顾国昌;基于强化学习的多机器人编队方法研究[J];计算机工程;2002年06期 |
7 |
孟伟,洪炳熔,韩学东;强化学习在机器人足球比赛中的应用[J];计算机应用研究;2002年06期 |
8 |
孙羽,张汝波,顾国昌;自组织映射神经网络量化机器人强化学习方法研究[J];小型微型计算机系统;2002年05期 |
9 |
殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期 |
10 |
程小平;邱玉辉;;基于强化学习的LVQ聚类方法[J];计算机科学;2002年12期 |
|