收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

从知识的表达和运用综述强化学习研究

陈宗海  杨志华  王海波  盛捷  
【摘要】:为推进强化学习研究的进一步深入和扩大其实际应用范围,从强化学习研究的理论基础——知识表示和运用的角度对强化学习进行分类,并就经典随机强化学习、模糊强化学习、定性强化学习以及灰色强化学习作了较详细的探讨与比较.最后从知识表达和运用的角度对强化学习的发展进行了展望.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 姜跃;朱光菊;朱林立;姜懿庭;;基于模糊逻辑的产生式-框架的知识表示及推理的研究[J];云南大学学报(自然科学版);2007年S2期
2 王岭娥;徐晓光;王刚;;基于模糊造纸专家系统中知识获取模块的设计[J];中国西部科技(学术);2007年13期
3 杨蓓,缑西梅,艾艳;专家系统中的模糊知识表示及推理研究[J];郑州大学学报(理学版);2004年02期
4 王洪飞,程帆;用模糊理论进行弹性支座压杆可靠性的设计[J];杭州电子工业学院学报;2001年04期
5 黄信想;刘秉瀚;;基于模糊理论的混沌变异粒子群算法[J];福州大学学报(自然科学版);2009年05期
6 杨明亮;;新兴的模糊计算机[J];今日科技;1991年04期
7 王海滋;陈健;刘娟;;基于多级模糊综合评判的房地产经纪人测评[J];山东建筑工程学院学报;2005年05期
8 左红艳;丁军强;;高校科技文献采访过程模糊评价模型及应用[J];邵阳学院学报(自然科学版);2006年02期
9 吕世威;;模糊理论在离合器上的应用[J];科技情报开发与经济;2006年15期
10 刘锦;李金林;;层次模糊决策模型在平衡记分卡综合评价中的应用[J];工业技术经济;2007年03期
11 吴艳娥;陈涛;高华;;模糊综合评判法在营销渠道风险评价中的应用[J];科技创业月刊;2007年12期
12 程世辉;戚君宜;高钰榕;;基于TFN模糊数的导航装备可靠性分配[J];电子产品可靠性与环境试验;2008年04期
13 吴芳;;基于神经网络的遥感影像分类方法研究[J];测绘科技情报;2007年02期
14 赵罗义;;模糊技术的研究及应用[J];河南科技;1992年06期
15 王磊,邢珺;模糊技术及其交叉学科[J];测控技术;1995年06期
16 李洪兴;因素空间理论与知识表示的数学框架(Ⅶ)──多重目标综合决策[J];模糊系统与数学;1995年02期
17 陈国华;模糊理论在焊缝缺陷质量等级评定中的应用研究[J];无损检测;1998年02期
18 刘弘,孙文星,刘希玉;一个多Agent设计概念学习系统[J];西南师范大学学报(自然科学版);2001年04期
19 钟儒祥,翁俊铿,张少通;应用模糊理论进行专业气象服务方法探讨[J];广东气象;2005年01期
20 周斌;模糊理论在线性规划问题中的运用探讨[J];攀枝花学院学报;2005年05期
中国重要会议论文全文数据库 前10条
1 韩东;杨进佩;薛奇;;模糊理论在故障诊断专家系统中的应用[A];1999中国控制与决策学术年会论文集[C];1999年
2 黄加祺;赵珣;张峰;;模糊理论在蓄电池充电系统中的应用[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(中册)[C];2008年
3 俞树荣;施哲雄;王志文;;含缺陷压力容器完整性的模糊综合评判[A];第四届全国压力容器学术会议论文集[C];1997年
4 乔园园;李太富;;模糊理论在汽车空调系统故障诊断中的应用[A];节能减排论坛——福建省科协第八届学术年会卫星会议论文专刊[C];2008年
5 刘晓东;;基于AFS代数和AFS结构的模糊理论[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 鲁剑锋;吴川;;基于模糊理论的自适应阈值实时DSP系统[A];2007年光电探测与制导技术的发展与应用研讨会论文集[C];2007年
7 戴光武;都洪基;贾磊;张晓萍;;基于模糊理论和故障树的连锁故障分析方法[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(中册)[C];2008年
8 苏有财;谷婷;朱勇;白志勇;;模糊理论在隧道施工阶段围岩等级划分中的应用[A];第三届全国岩土与工程学术大会论文集[C];2009年
9 罗小明;杨惠鹄;;二元模糊比较法及其在军事指挥决策中的应用[A];1995中国控制与决策学术年会论文集[C];1995年
10 蔡怀平;陈英武;;模糊风险分析方法的应用与评价[A];第二届不确定系统年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
5 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
6 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
7 孙力;基于模糊理论的化工过程多目标优化集成研究[D];大连理工大学;2004年
8 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
9 佘莉;基于语义的几何学科知识平台[D];中国科学院研究生院(成都计算机应用研究所);2006年
10 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
中国硕士学位论文全文数据库 前10条
1 姜沛然;基于模糊理论和强化学习的自主式水下机器人运动规划技术[D];哈尔滨工程大学;2005年
2 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
7 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
8 王岭娥;基于模糊理论的造纸专家系统[D];天津大学;2005年
9 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
10 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 林 鸣;错位的“模糊理论”[N];中国质量报;2004年
7 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
8 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
9 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
10 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978