收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

对称协调博弈问题的多智能体强化学习

王云  韩伟  
【摘要】:针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0和1两个值上调整即可协调成功。以多机器人避碰为实验背景进行仿真,表明算法比现有方法能够取得更好的协调性能。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王强;王玉振;;Hamilton框架下Flocking问题控制协议的设计[J];山东大学学报(理学版);2011年07期
2 夏丽丽;;连续状态-连续行动强化学习[J];电脑知识与技术;2011年19期
3 朱亚东;杜晋;王芹;;多智能体的鲁棒自适应有向三角编队控制[J];扬州职业大学学报;2011年02期
4 佘莹莹;方华京;;基于一类连续非线性函数的多智能体系统有限时间一致性[J];控制与决策;2011年07期
5 祝宇虹;毛俊鑫;;基于人工情感与Q学习的机器人行为决策[J];机械与电子;2011年07期
6 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
7 ;编者的话[J];计算机仿真;2011年07期
8 佘莹莹;方华京;;多智能体系统的有限时间跟踪控制[J];系统工程与电子技术;2011年08期
9 宋述宏;;基于MAS-SOA的微网群广域协同控制[J];电工技术;2011年07期
10 孙凤兰;关治洪;;具有变通信时延的多智能体系统的平均一致性[J];华中科技大学学报(自然科学版);2011年07期
11 李少斌;杨忠;陈喆;杨成顺;黄宵宁;;一种基于邻域感知的群集控制算法[J];应用科技;2011年07期
12 金达开;;多智能体系统跟踪领导节点的随机一致性问题研究[J];微型电脑应用;2011年06期
13 许培;薛伟;;基于Q-learning的一种多Agent系统结构模型[J];计算机与数字工程;2011年08期
14 王雪茹;袁建清;崔然;;多智能体技术及其在交通控制系统中的应用[J];中国新技术新产品;2011年17期
15 熊坤鹏;卢俊国;;具有动态领导节点的多智能体系统一致性分析[J];微型电脑应用;2011年06期
16 谢国琪;彭军;张晓勇;;结合带权与或树和AOE-网的任务规划研究[J];计算机工程与应用;2011年19期
17 吴怀宇;郑秀娟;程磊;张玉礼;;多机器人编队的仿真实验教学研究[J];电气电子教学学报;2011年03期
18 宋大雷;葛磊华;魏爱敏;李艳丽;;基于远方优先的机器人足球角色分配策略的研究[J];计算机应用与软件;2011年07期
19 刘一松;李倩倩;;一种最优规划程序设计语言OPPLFC[J];计算机应用研究;2011年08期
20 蔡建羡;阮晓钢;;基于遗传算法的Skinner操作条件反射学习模型[J];系统工程与电子技术;2011年06期
中国重要会议论文全文数据库 前10条
1 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
2 潘凌寒;程显毅;;RoboCup仿真比赛中机器学习问题的研究[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
3 张文广;郭振凯;;一类高阶多智能体系统的一致控制研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
4 杨熙;王金枝;;多智能体系统一致性的鲁棒性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
5 张亚;田玉平;;离散时间多智能体系统一致的权重条件[A];中国自动化学会控制理论专业委员会B卷[C];2011年
6 杨熙;王金枝;;Leader-Follower结构下多智能体系统一致性的鲁棒性能分析[A];第二十九届中国控制会议论文集[C];2010年
7 薛栋;姚静;余有灵;胡俊杰;;具有切换拓扑和非线性环节的关联多智能体系统一致性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
8 刘华罡;方浩;毛昱天;曹虎;贾睿;;多智能体系统分布式群集运动与避障控制[A];第二十九届中国控制会议论文集[C];2010年
9 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
10 杜春侠;;基于模糊先验知识的Q学习及在足球机器人系统中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
2 王强;低阶多智能体系统分析与控制协议设计[D];山东大学;2012年
3 佘莹莹;多智能体系统一致性若干问题的研究[D];华中科技大学;2010年
4 金钊;加速强化学习方法研究[D];云南大学;2010年
5 彭科;带领导者的多智能体系统中的一致性问题研究[D];上海交通大学;2009年
6 徐明亮;强化学习及其应用研究[D];江南大学;2010年
7 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
8 刘海涛;多智能体机器人系统中的若干通信技术研究[D];哈尔滨工业大学;2007年
9 吴锋;基于决策理论的多智能体系统规划问题研究[D];中国科学技术大学;2011年
10 李扬;网络环境下多智能体协调控制研究[D];中国海洋大学;2012年
中国硕士学位论文全文数据库 前10条
1 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
2 郭华;分布式足球机器人学习与协作研究[D];西北工业大学;2006年
3 薛丽华;多智能体协作学习方法的研究[D];长沙理工大学;2008年
4 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
5 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
6 刘飞;强化学习方法在多机器人博弈系统中的应用研究[D];华北电力大学(北京);2011年
7 李锋;多智能体Q学习在多AUV协调中的应用与仿真[D];哈尔滨工程大学;2008年
8 尚旭辉;TSR-1足球机器人底层控制系统及通讯子系统的研究[D];天津大学;2004年
9 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
10 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
中国重要报纸全文数据库 前3条
1 记者 吴长锋;中科大机器人“可佳”能思考会推理[N];科技日报;2009年
2 沈建苗 编译;人工智能步入壮年期[N];计算机世界;2009年
3 记者 桂运安;“机器人世界杯”科大摘金夺银[N];安徽日报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978