收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于强化学习的多智能体协作方法研究

童亮  陆际联  
【摘要】:为了在连续和动态的环境中处理智能体不断变化的需求,我们通过利用强化学习来研究多机器人推箱子问题,得到了一种智能体可以不需要其它智能体任何信息的情况下完成协作任务的方法。强化学习可以应用于合作和非合作场合,对于存在噪声干扰和通讯困难的情况,强化学习具有其它人工智能方法不可比拟的优越性。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 金福江;;Agent的多目标优化分布式智能算法[J];华侨大学学报(自然科学版);2005年04期
2 马良荔,贲可荣;使用多Agent模型求解N-难题的新方法[J];海军工程学院学报;1996年04期
3 朱建伟,陈健;多智能体系统技术概论[J];机电设备;2004年03期
4 修世军;Mas冲突管理模型[J];丹东纺专学报;2005年01期
5 范波,潘泉,张洪才;一种基于分布式强化学习的多智能体协调方法[J];计算机仿真;2005年06期
6 王健强;杜辉;于澎;;机器人点焊工作站在汽车制造中的应用[J];机器人技术与应用;2006年04期
7 沈寿林;韩晓强;白承森;;Agent技术及其在作战模拟中的应用[J];计算机仿真;2006年09期
8 倪小雷;卜佳俊;;自主移动机器人混合式体系结构的设计与实现[J];计算机测量与控制;2006年11期
9 郭磊;陈进;王国伟;;基于多智能体的设备性能退化评估系统建模[J];计算机集成制造系统;2008年03期
10 王云;韩伟;;对称协调博弈问题的多智能体强化学习[J];计算机工程与应用;2008年36期
11 徐丽群;李斌;;基于DCOM的动态运输调度多智能体系统研究[J];计算机应用研究;2009年03期
12 林茜;吴晓锋;;时滞多智能体系统关于参考状态的信息一致性[J];系统工程学报;2010年06期
13 谭树彬;刘建昌;;Multi-Agent的连续轧制过程控制系统研究[J];智能系统学报;2008年02期
14 张继军;田宝国;张继平;张金春;;基于遗传算法的多智能体联盟形成机制[J];计算机工程;2009年06期
15 周文军;孙玫;王玉玺;吴旭;;基于协进化和CPN的多智能体系统建模[J];微计算机信息;2010年05期
16 顾建忠;杨洪勇;;多智能体系统的分布协调控制[J];控制工程;2010年S2期
17 梁泉,许晓鸣,何星,张钟俊;多智能体系统智能体协作层的设计与实现[J];上海交通大学学报;1996年04期
18 谢云,杨宜民,彭超;微型机器人足球系统中的通信子系统设计[J];电子技术;2001年08期
19 莫赞华,韦卫星,冯珊,唐超;一种基于智能体的决策支持系统集成模型研究[J];华中科技大学学报(自然科学版);2003年10期
20 王国权,徐竞青,于海斌;一种多智能体系统任务竞争模型及算法研究[J];信息与控制;2005年04期
中国重要会议论文全文数据库 前10条
1 张文广;郭振凯;;一类高阶多智能体系统的一致控制研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
2 杨熙;王金枝;;多智能体系统一致性的鲁棒性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
3 张亚;田玉平;;离散时间多智能体系统一致的权重条件[A];中国自动化学会控制理论专业委员会B卷[C];2011年
4 杨熙;王金枝;;Leader-Follower结构下多智能体系统一致性的鲁棒性能分析[A];第二十九届中国控制会议论文集[C];2010年
5 薛栋;姚静;余有灵;胡俊杰;;具有切换拓扑和非线性环节的关联多智能体系统一致性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 刘华罡;方浩;毛昱天;曹虎;贾睿;;多智能体系统分布式群集运动与避障控制[A];第二十九届中国控制会议论文集[C];2010年
7 孙铁利;杨永明;赵晶晶;;营救智能体的研究与开发[A];2005年全国理论计算机科学学术年会论文集[C];2005年
8 王莉;陈增强;刘忠信;袁著祉;;基于势函数的具有多LEADER的多智能体系统的运动控制[A];第二十六届中国控制会议论文集[C];2007年
9 薛宏涛;沈林成;;基于协进化方法的多智能体系统及其符号演绎理论模型[A];第二十六届中国控制会议论文集[C];2007年
10 肖晴;许维胜;吴启迪;;多智能体系统用于企业集成[A];1998年中国控制会议论文集[C];1998年
中国博士学位论文全文数据库 前10条
1 王强;低阶多智能体系统分析与控制协议设计[D];山东大学;2012年
2 佘莹莹;多智能体系统一致性若干问题的研究[D];华中科技大学;2010年
3 唐朝君;多智能体系统一致性问题与包含控制问题研究[D];电子科技大学;2012年
4 彭科;带领导者的多智能体系统中的一致性问题研究[D];上海交通大学;2009年
5 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
6 吴锋;基于决策理论的多智能体系统规划问题研究[D];中国科学技术大学;2011年
7 李扬;网络环境下多智能体协调控制研究[D];中国海洋大学;2012年
8 钟伟才;多智能体进化模型和算法研究[D];西安电子科技大学;2004年
9 唐平;多智能体系统冲突消解与智能机器人动态路径规划研究[D];广东工业大学;2002年
10 骆翔宇;多智能体系统的符号模型检测[D];中山大学;2006年
中国硕士学位论文全文数据库 前10条
1 尚旭辉;TSR-1足球机器人底层控制系统及通讯子系统的研究[D];天津大学;2004年
2 邱宇航;协作协进化算法应用于多智能体协作的研究[D];浙江工业大学;2005年
3 张晓勇;RoboCup中多智能体系统协作的研究与实现[D];中南大学;2005年
4 秦志斌;自主移动机器人高可靠性软件体系结构研究[D];浙江大学;2006年
5 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
6 杨俊卿;多移动机器人围捕算法的研究[D];山东科技大学;2005年
7 朱莹莹;基于Multi-Agent仿真机器人足球比赛策略研究与开发[D];华北电力大学(北京);2006年
8 郑旭栋;基于多智能体的车间调度系统研究[D];上海交通大学;2007年
9 刘苗;多智能体协作策略的研究及在RoboCup中的应用[D];中南大学;2008年
10 姚玉霞;基于多智能体人工鱼群算法应用研究[D];西安建筑科技大学;2008年
中国重要报纸全文数据库 前2条
1 记者 吴长锋;中科大机器人“可佳”能思考会推理[N];科技日报;2009年
2 记者 桂运安;“机器人世界杯”科大摘金夺银[N];安徽日报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978