收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

强化学习原理、算法及应用

黄炳强  曹广益  王占全  
【摘要】:强化学习(ReinforcementLearningRL)是从动物学习理论发展而来的,它不需要有先验知识,通过不断与环境交互来获得知识,自主的进行动作选择,具有自主学习能力,在自主机器人行为学习中受到广泛重视.本文综述了强化学习的基本原理,各种算法,包括TD算法、Q-学习和R学习等,最后介绍了强化学习的应用及其在多机器人系统中的研究热点问题.

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 俞星星,阎平凡;强化学习系统及其基于可靠度最优的学习算法[J];信息与控制;1997年05期
2 马莉,蔡自兴;基于强化学习的模糊自适应控制器[J];中南工业大学学报(自然科学版);1998年02期
3 张汝波,周宁,顾国昌,张国印;基于强化学习的智能机器人避碰方法研究[J];机器人;1999年03期
4 张健沛,王醒策,张岩,张汝波,温丽华;连续动作强化学习及其在机器人中的应用研究[J];哈尔滨工程大学学报;2000年03期
5 周锐,陈宗基;强化学习在导弹制导中的应用[J];控制理论与应用;2001年05期
6 王醒策,张汝波,顾国昌;基于强化学习的多机器人编队方法研究[J];计算机工程;2002年06期
7 孟伟,洪炳熔,韩学东;强化学习在机器人足球比赛中的应用[J];计算机应用研究;2002年06期
8 孙羽,张汝波,顾国昌;自组织映射神经网络量化机器人强化学习方法研究[J];小型微型计算机系统;2002年05期
9 殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期
10 程小平;邱玉辉;;基于强化学习的LVQ聚类方法[J];计算机科学;2002年12期
中国重要会议论文全文数据库 前10条
1 胡光华;;部分可观测MDP强化学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 曾光;;中国现场流行病学培训项目简介及进展[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年
3 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
4 朴松昊;洪炳熔;褚海涛;;基于BDI的多Agent协作模型研究[A];2003中国控制与决策学术年会论文集[C];2003年
5 徐义春;韩芳;;结合TD(0)的马尔可夫链扰动分析求解算法[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
6 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
7 任燚;陈宗海;;一种强化学习算法应用于多移动机器人的觅食实例研究[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
8 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
9 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
10 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 王笑蓉;蚁群优化的理论模型及在生产调度中的应用研究[D];浙江大学;2003年
2 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
3 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
4 郭剑;电力市场环境下的电力系统分析方法研究[D];中国电力科学研究院;2001年
5 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
6 常文君;基于神经网络的多水下机器人协调控制方法研究[D];哈尔滨工程大学;2004年
7 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
8 王长缨;多agent协作团队的学习方法研究[D];国防科学技术大学;2004年
9 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
10 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
中国硕士学位论文全文数据库 前10条
1 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年
2 嘉莉;具有学习机制的电子商务自动谈判研究[D];西南师范大学;2003年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 张必勇;强化学习在用户学习中的应用研究[D];太原理工大学;2003年
5 赵秀粉;蓝牙技术及多代理技术在车间控制系统中的应用研究[D];重庆大学;2003年
6 莫建文;机器自学习博弈策略研究与实现[D];广西师范大学;2002年
7 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
8 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
9 孙光余;强化学习及其在空中拦截中的应用[D];沈阳工业大学;2004年
10 张慧;基于强化学习的倒立摆控制[D];太原理工大学;2004年
中国重要报纸全文数据库 前10条
1 记者 聂卫星 通讯员 师占卿;山西分行强化学习效果[N];中国城乡金融报;2000年
2 杨启荣;廊坊市开展解放思想大讨论[N];河北日报;2000年
3 记者 董宏君;交流理论学习的体会和经验[N];人民日报;2000年
4 本报记者 黄鹏;大步迈向网络化办公[N];中国工商报;2001年
5 郑言;怎样培养孩子的学习兴趣[N];湖南科技报;2001年
6 亚佩;后进生转化工作中的点滴经验[N];西藏日报;2001年
7 吉林省永吉机关幼儿园 梁艳华;园长要有六种意识[N];中国教育资讯报;2002年
8 通讯员张建辉 记者吕向辉;青年科技工作者要敢为人先[N];河北日报;2002年
9 本报记者 李劲松;狠抓职业道德 精铸灵魂工程[N];人民法院报;2002年
10 武建新、张淑会;井陉着力培养学习型干部[N];河北日报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978