收藏本站
《科学技术与工程》 2011年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于强化学习的全自主机器人足球系统协作研究

王腾  李长江  
【摘要】:从人工智能的角度上说,机器人足球比赛主要研究了多智能体系统要解决的分布的多机器人在复杂的动态环境下,如何通过相互协商完成某一复杂任务。全自主机器人足球是机器人足球发展的一个趋势,在完全未知的环境中,通过自身学习来了解和积累外部信息。对于传统强化学习,存在容易出现死锁,学习速度慢,要求外部条件是静态等缺陷。提出了一种基于蚁群算法的强化学习模型,即蚁群算法与Q学习相结合的思想。随着赛场上态势的渐趋复杂,传统的Q学习速度会变得很慢且交互困难。通过对新算法的分析,实验数据显示:新算法不仅提高了Q学习的学习速率,在解决状态空间维数的灾难问题上,也是可行的。
【作者单位】西北工业大学计算机学院;
【分类号】:TP242.6

【参考文献】
中国期刊全文数据库 前1条
1 孙焘,王秀坤,刘业欣,张名举;一种简单蚂蚁算法及其收敛性分析[J];小型微型计算机系统;2003年08期
【共引文献】
中国期刊全文数据库 前5条
1 段海滨;王道波;于秀芬;;蚁群算法的研究现状及其展望[J];中国工程科学;2007年02期
2 高尚;杨静宇;;最短路的蚁群算法收敛性分析[J];科学技术与工程;2006年03期
3 冯远静,冯祖仁,彭勤科;一类自适应蚁群算法及其收敛性分析[J];控制理论与应用;2005年05期
4 段海滨,王道波,朱家强,黄向华;蚁群算法理论及应用研究的进展[J];控制与决策;2004年12期
5 段海滨;王道波;于秀芬;;基本蚁群算法的A.S.收敛性研究[J];应用基础与工程科学学报;2006年02期
中国博士学位论文全文数据库 前9条
1 程志刚;连续蚁群优化算法的研究及其化工应用[D];浙江大学;2005年
2 许毅;基于IP网络QoS多播路由技术的研究[D];武汉理工大学;2005年
3 王俊伟;粒子群优化算法的改进及应用[D];东北大学;2006年
4 高尚;蚁群算法理论、应用及其与其它算法的混合[D];南京理工大学;2005年
5 左洪浩;蚁群优化算法及其应用研究[D];中国科学技术大学;2006年
6 王超学;遗传算法和蚁群算法及其在TSP问题和配电网重构问题中的应用研究[D];西安理工大学;2007年
7 刘彦鹏;蚁群优化算法的理论研究及其应用[D];浙江大学;2007年
8 李澄非;计算智能方法研究及其在流程工业中应用[D];北京化工大学;2007年
9 贺益君;群智能优化方法及其在化学化工中的应用研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 秦玲;蚁群算法的改进与应用[D];扬州大学;2004年
2 王雅娣;基于智能蚂蚁算法优化的脱硫静态模型研究[D];重庆大学;2004年
3 肇勇;改进蚁群算法的理论及方法研究[D];西南石油学院;2004年
4 周华;蚁群算法在开拓系统结构优化中的应用研究[D];西安建筑科技大学;2005年
5 寇晓丽;蚁群优化算法及其应用[D];西安电子科技大学;2006年
6 王佳超;应用蚁群算法进行物流配送路线优化研究[D];大连海事大学;2006年
7 单芳;基于改进蚁群算法的机器人路径规划研究[D];天津财经大学;2006年
8 殷志锋;蚁群算法及其在多用户检测中的应用[D];兰州大学;2006年
9 屠莉;蚁群优化算法在数据挖掘中的应用研究[D];扬州大学;2006年
10 万伟锋;彬长矿区矿井水资源化及坑口电站净水厂优化选址研究[D];长安大学;2006年
【二级参考文献】
中国期刊全文数据库 前6条
1 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
2 谭民,范永,徐国华;机器人群体协作与控制的研究[J];机器人;2001年02期
3 郭锐,彭军,吴敏;增强Q学习在非确定马尔可夫系统寻优问题中的应用[J];计算机工程与应用;2005年13期
4 路军,王亚东,王晓龙;BDI Agent解释器的研究和改进[J];软件学报;2000年08期
5 陈崚,沈洁,秦玲;蚁群算法求解连续空间优化问题的一种方法[J];软件学报;2002年12期
6 孙焘,王秀坤,刘业欣,张名举;一种简单蚂蚁算法及其收敛性分析[J];小型微型计算机系统;2003年08期
中国硕士学位论文全文数据库 前1条
1 虞靖靓;基于Q学习的Agent智能决策的研究与实现[D];合肥工业大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 许培;薛伟;;基于Q-learning的一种多Agent系统结构模型[J];计算机与数字工程;2011年08期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 张衡;程显毅;张吉刚;陈小波;;基于Q学习的足球机器人协作策略[A];2005中国机器人大赛论文集[C];2005年
2 马洁;李茂;邱国霞;张志涌;;Q学习在RoboCup个体技术中的应用[A];2005中国机器人大赛论文集[C];2005年
3 郭晓军;袁阳;杨建军;李红卫;;一类多智能体学习算法的研究及应用[A];2007年中国智能自动化会议论文集[C];2007年
4 杨茂;田彦涛;杨永明;刘宗春;;基于改进粒子群优化算法的多机器人合作Q学习[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
5 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
6 宋楠;赵忠文;刘帅;戴迎春;;基于势能场的MAS局部合作Q学习算法[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
7 余斌;李龙澍;徐怡;;一种用于Kick问题的模糊增强学习[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 刘志远;林伟;张树林;;解析方法的Kick在RoboCup中的应用[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
9 李春光;刘国栋;;Robocup中基于Q学习的射门模块设计[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
10 杜春侠;;基于模糊先验知识的Q学习及在足球机器人系统中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前4条
1 陈圣磊;强化学习及其在MAS协同概念设计中应用的研究[D];南京理工大学;2006年
2 叶强;基于改进蚁群算法的一类单机调度问题研究[D];合肥工业大学;2008年
3 曹江丽;水下机器人路径规划问题的关键技术研究[D];哈尔滨工程大学;2009年
4 朱从民;AGV AGENT控制系统研究[D];西安理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵慧;基于激光雷达和神经网络的移动机器人综合局部路径规划[D];中南大学;2004年
2 李春光;RoboCup仿真比赛环境下多智能体系统设计及其学习问题研究[D];江南大学;2004年
3 章苏书;机器人足球环境下的多机器人协作设计[D];中南大学;2004年
4 高建清;基于模糊Q学习的Agent智能决策研究与实现[D];合肥工业大学;2006年
5 李锋;多智能体Q学习在多AUV协调中的应用与仿真[D];哈尔滨工程大学;2008年
6 虞靖靓;基于Q学习的Agent智能决策的研究与实现[D];合肥工业大学;2005年
7 施卫强;基于强化学习的足球机器人决策系统设计[D];中南大学;2007年
8 吴洪岩;基于强化学习的自主移动机器人导航研究[D];东北师范大学;2009年
9 赵昀;有关强化学习的若干问题研究[D];南京理工大学;2009年
10 余柏峰;结合“捕食者—猎物”问题的多Agent协作机制研究[D];国防科学技术大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026