收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于划分和集成思想的多智能体强化学习

王云  韩伟  
【摘要】:针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能.

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 李国秋;;情报检索语言中的过程研究[J];图书情报知识;1988年04期
2 沈文;;中国版协、中国记协将举办新闻、出版专业英语强化班[J];中国出版;1988年08期
3 石纯一,王克宏,胡蓬,康小强;面向篇章理解的多智能体系统MAS/TH-3[J];计算机学报;1995年09期
4 朱淼良,吴春明,张友军,金毅,李捷;基于多智能体的实时并发式智能机器人结构[J];高技术通讯;1995年10期
5 马光源,刘岚,张金如;一种改进的双向联想存储器[J];武汉工业大学学报;1995年01期
6 张邦礼,李银国,曹长修;非线性系统神经网络辨识的鲁棒BP算法[J];控制与决策;1996年01期
7 梁泉,许晓鸣,张钟俊;多智能体系统协作及控制机理和基本问题分析[J];控制与决策;1996年05期
8 梁泉,许晓鸣,何星,张钟俊;多智能体系统智能体协作层的设计与实现[J];上海交通大学学报;1996年04期
9 张国新,沈绪榜,王新安;模糊控制在航天航空领域中的应用[J];微电子学与计算机;1996年01期
10 魏峻,潘正君,康立山;基于演化规划的多智能体系统中动态行为的建模[J];小型微型计算机系统;1996年10期
中国重要会议论文全文数据库 前10条
1 孙增圻;李实;;RoboCup与智能自动化技术[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
2 邓宏钟;殷建平;谭跃进;;一种用于构造DAI系统模型的扩展时态信念逻辑[A];1999年中国智能自动化学术会议论文集(下册)[C];1999年
3 李实;徐旭明;叶榛;孙增圻;;机器人足球仿真比赛的Server模型[A];1999年中国智能自动化学术会议论文集(下册)[C];1999年
4 肖晴;许维胜;吴启迪;;多智能体系统用于企业集成[A];1998年中国控制会议论文集[C];1998年
5 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
6 王云莉;段广洪;王先逵;;基于多智能体机制的刀具选择方法[A];第一届国际机械工程学术会议论文集[C];2000年
7 胡光华;;部分可观测MDP强化学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
8 邓君令;杨宜民;;足球机器人模糊局部路径规划器的设计[A];2001年中国智能自动化会议论文集(上册)[C];2001年
9 夏卫峰;费敏锐;;遗传算法及其在一类多智能体系统中的应用[A];2001年中国智能自动化会议论文集(下册)[C];2001年
10 王瑛;侯朝桢;冯天飞;;分布式智能控制的研究[A];2001中国控制与决策学术年会论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 唐振民;智能移动机器人及群体关键技术研究[D];南京理工大学;2002年
2 唐平;多智能体系统冲突消解与智能机器人动态路径规划研究[D];广东工业大学;2002年
3 王笑蓉;蚁群优化的理论模型及在生产调度中的应用研究[D];浙江大学;2003年
4 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
5 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
6 郭剑;电力市场环境下的电力系统分析方法研究[D];中国电力科学研究院;2001年
7 薛宏涛;基于协进化机制的多智能体系统体系结构及多智能体协作方法研究[D];中国人民解放军国防科学技术大学;2002年
8 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
9 杨勇;化工批处理过程调度的建模与优化[D];浙江大学;2003年
10 李志华;循环子空间回归建模和多智能体遗传优化[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 邓君令;多智能体协同作业的初步研究[D];广东工业大学;2001年
2 陈承志;RoboCup仿真比赛系统的研究[D];广东工业大学;2002年
3 李夏;基于可拓学的足球机器人系统策略及冲突消解的研究[D];广东工业大学;2002年
4 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年
5 余明艳;基于协同的足球机器人智能决策系统及冲突消解的研究[D];广东工业大学;2003年
6 张学习;MiroSot足球机器人的研制[D];广东工业大学;2003年
7 沈志忠;多智能体及其在生产系统的控制和故障诊断中的应用[D];河北工业大学;2003年
8 嘉莉;具有学习机制的电子商务自动谈判研究[D];西南师范大学;2003年
9 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
10 耿建鲁;基于黑板系统的多智能体系实现方法的研究[D];哈尔滨工程大学;2003年
中国重要报纸全文数据库 前10条
1 记者 聂卫星 通讯员 师占卿;山西分行强化学习效果[N];中国城乡金融报;2000年
2 杨启荣;廊坊市开展解放思想大讨论[N];河北日报;2000年
3 记者 董宏君;交流理论学习的体会和经验[N];人民日报;2000年
4 本报记者 黄鹏;大步迈向网络化办公[N];中国工商报;2001年
5 郑言;怎样培养孩子的学习兴趣[N];湖南科技报;2001年
6 ;多智能体系统开发环境(MBOS)[N];计算机世界;2001年
7 亚佩;后进生转化工作中的点滴经验[N];西藏日报;2001年
8 吉林省永吉机关幼儿园 梁艳华;园长要有六种意识[N];中国教育资讯报;2002年
9 通讯员张建辉 记者吕向辉;青年科技工作者要敢为人先[N];河北日报;2002年
10 本报记者 李劲松;狠抓职业道德 精铸灵魂工程[N];人民法院报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978