收藏本站
《大众科技》 2008年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于DFL的agent自主学习的规划研究

段爱华  
【摘要】:根据Agent学习过程中的规划的特点,采用部分全局方法,采用意图规划和强化学习方法相结合的方法,形成一种新的规划方法。
【作者单位】安徽财经大学信息工程学院
【基金】:安徽省高校青年教师科研资助项目(2006jq1109)
【分类号】:TP18

【参考文献】
中国期刊全文数据库 前4条
1 汤九斌,高阳,陈世福;基于规划规则的激励学习偏差研究[J];复旦学报(自然科学版);2004年05期
2 曾伟,费奇;Agent规划的形式化描述[J];华中科技大学学报;2001年08期
3 董明楷,张海俊,史忠植;基于动态描述逻辑的主体模型[J];计算机研究与发展;2004年05期
4 汪勇;熊前兴;;基于进化规划的多Agent系统任务调度[J];计算机工程与设计;2006年20期
【共引文献】
中国期刊全文数据库 前10条
1 蒋运承;史忠植;汤庸;王驹;;一种分布式动态描述逻辑[J];计算机研究与发展;2006年09期
2 张燕;;描述逻辑研究进展[J];江南大学学报(自然科学版);2010年01期
3 张秋花;薛惠锋;吴介军;寇晓东;;多智能体系统MAS及其应用[J];计算机仿真;2007年06期
4 向阳;张波;张蓓;黄震华;;语义决策过程支撑环境及其语义表示方法[J];控制与决策;2009年09期
5 马炳先;徐颖蕾;;动态描述逻辑动作间关系的Petri网分析方法研究[J];自动化学报;2007年11期
6 凌兴宏;黄志球;刘全;李凡长;崔志明;;面向agent的统一知识表示与推理逻辑框架[J];南京大学学报(自然科学版);2008年02期
7 马勇;诸叶平;;基于Agent的农产品可追溯系统研究[J];农机化研究;2010年07期
8 康达周;徐宝文;陆建江;李言辉;;支持术语公理约束的扩展模糊描述逻辑推理[J];软件学报;2007年07期
9 李言辉;徐宝文;陆建江;康达周;;一般术语公理下的模糊描述逻辑FALCN推理[J];软件学报;2008年03期
10 李海刚,吴启迪;多Agent系统研究综述[J];同济大学学报(自然科学版);2003年06期
中国博士学位论文全文数据库 前10条
1 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
2 付相君;基于本体和Semantic Web技术的产品知识集成基础研究[D];浙江大学;2005年
3 蒋运承;基于主体的智能Web中的服务研究[D];中国科学院研究生院(计算技术研究所);2004年
4 张海俊;基于主体的自主计算研究[D];中国科学院研究生院(计算技术研究所);2005年
5 王宏刚;MAS在行车调度系统中的应用研究[D];铁道部科学研究院;2006年
6 董明楷;面向智能主体的动态描述逻辑研究[D];中国科学院研究生院(计算技术研究所);2003年
7 刘芳;基于过程本体的异质Agent协作技术研究[D];国防科学技术大学;2006年
8 陈丁剑;基于语义的Web服务发现和组合技术研究[D];西北工业大学;2007年
9 马巧云;基于多Agent系统的动态任务分配研究[D];华中科技大学;2006年
10 彭艳斌;基于准则和策略的自治式多agent服务协同体系研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前9条
1 卢舢;基于Pi演算的本体演化形式化方法研究[D];吉林大学;2011年
2 隋青秀;迁移工作流系统中联盟导航方法研究[D];山东大学;2011年
3 刘佳奇;远程控制实验室多Agent模型的研究与实现[D];哈尔滨工业大学;2011年
4 段爱华;基于DFL的Agent自主学习模型及其应用研究[D];苏州大学;2005年
5 汪美玲;Pi演算与动态描述逻辑DDL的关系及其应用研究[D];吉林大学;2007年
6 董龙明;基于过程本体的异质Agent协作模型的研究[D];国防科学技术大学;2007年
7 王军;基于描述逻辑的语义Web知识表示和推理[D];广西师范大学;2008年
8 谢国琪;基于带权与或树和AOE-网的多智能体动态任务规划研究[D];中南大学;2010年
9 董学阳;本体演化的表示方法及其验证[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前9条
1 曾伟,费奇;基于MAS理论的组织建模[J];华中理工大学学报;2000年08期
2 夏洪山,许峰;分布式实时系统中的多Agent调度[J];南京航空航天大学学报;2004年03期
3 张民,王向军,嵇斗;一种多群进化规划算法[J];数据采集与处理;2004年03期
4 孙志强,姚淑珍;基于SOAP实现异种多Agent系统间互操作[J];计算机工程与设计;2004年11期
5 吴瑜,叶荣华,高济;面向Web服务的多Agent系统的通信机制[J];计算机工程与设计;2004年11期
6 石立宝,徐国禹;进化规划动态寻优机理分析[J];数学的实践与认识;2002年05期
7 吴庆洪,张纪会,徐心和;一种有效的进化规划算法[J];系统仿真学报;1999年06期
8 林丹,李敏强,寇纪淞;进化规划中防治早熟收敛的方法[J];系统工程学报;2001年03期
9 翁妙凤;基于并行进化规划的Job Shop动态调度策略[J];小型微型计算机系统;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期
2 李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期
3 刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期
4 宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期
5 何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期
6 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
7 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
8 张荣,陈卫东;基于强化学习的倒立摆起摆与平衡全过程控制[J];系统工程与电子技术;2004年01期
9 张化祥;黄上腾;;基于强化学习与对策的多代理协同技术[J];计算机科学;2004年08期
10 王本年;高阳;陈兆乾;谢俊元;陈世福;;RLGA:一种基于强化学习机制的遗传算法[J];电子学报;2006年05期
中国重要会议论文全文数据库 前10条
1 张驭寰;;我国十六世纪的一幅镇城规划图[A];建筑历史与理论(第二辑)[C];1981年
2 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
4 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
5 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
6 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
7 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
8 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
9 叶道年;陈卫东;;机器人团队协作的强化学习[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
10 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 程维;中石油中远期油气规划图重庆成四大节点之一[N];第一财经日报;2007年
5 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
6 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
7 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
8 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
9 本报记者 童海华 苟俊;青木川镇画出了第一份规划图[N];中国经济导报;2008年
10 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
5 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
6 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
7 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
8 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
9 祖丽楠;多机器人系统自主协作控制与强化学习研究[D];吉林大学;2006年
10 孙碧波;基于学习行为的噪声交易者情绪演化研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
2 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
3 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
4 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
5 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
6 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
7 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
8 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
9 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
10 汪向利;基于多Agent的生产计划与调度系统研究与开发[D];浙江工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026