收藏本站
《上海交通大学学报》 2005年S1期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一般和对策中基于协商的多代理强化学习

张化祥  赵彤  黄上腾  
【摘要】:一般和对策中,只考虑个体理性的多代理协作是一种无全局目标的协作.代理学习基于对手策略假设,不能保证假设的正确性.为此通过定义代理协作的集体目标,提出了一种基于多代理协商的代理强化学习算法.代理选择协商策略,并惩罚偏离该策略的代理来保证协商策略的执行.文中给出了学习收敛的条件及证明,并以实例加以分析.

【相似文献】
中国期刊全文数据库 前10条
1 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
2 李晓萌,杨煜普,许晓鸣;基于Markov对策和强化学习的多智能体协作研究[J];上海交通大学学报;2001年02期
3 杨煜普,李晓萌,许晓鸣;多智能体协作技术综述[J];信息与控制;2001年04期
4 李晓萌,杨煜普,许晓鸣;基于多级决策的多智能体自动导航车调度系统[J];上海交通大学学报;2002年08期
5 陈雪江,杨东勇;基于强化学习的多智能体协作实现[J];浙江工业大学学报;2004年05期
6 张化祥;黄上腾;;多代理最优响应Q学习及收敛性证明[J];计算机科学;2004年04期
7 范波,潘泉,张洪才;基于Markov对策的多智能体协调方法及其在Robot Soccer中的应用[J];机器人;2005年01期
8 陈雪江,杨东勇,范荣真;多智能体协作的两层强化学习实现方法[J];计算机工程;2005年03期
9 张化祥,赵彤,黄上腾;一般和对策中基于协商的多代理强化学习[J];上海交通大学学报;2005年S1期
10 李镇宇,陈小平;基于Markov对策的强化学习及其在RoboCup中的应用[J];计算机工程与应用;2005年27期
中国博士学位论文全文数据库 前1条
1 范波;基于Agent的多机器人信息融合与协调研究[D];西北工业大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026