收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

评“基于情景记忆的量子深度强化学习”

吴热冰  
【摘要】:正强化学习作为一类重要的机器学习模型,用于解决人工智能体如何在环境中采取行动以最大化其累积奖励的问题。其中,深度强化学习利用深度神经网络生成人工智能体的动作选择策略,可以有效解决基于离散动作空间和连续动作空间的强化学习问题。然而,随着任务环境变得复杂,利用经典神经网络生成人工智能体的动作选择策略需要扩大经典神经网络规模,从而导致其参数数量激增。因此,

知网文化
【相似文献】
中国期刊全文数据库 前12条
1 古天龙;李龙;;伦理智能体及其设计:现状和展望[J];计算机学报;2021年03期
2 李少远;殷翔;;智能体自我博弈学习是否存在性能极限?[J];上海交通大学学报;2021年S1期
3 任晓明;李熙;;自我升级智能体的逻辑与认知问题[J];中国社会科学;2019年12期
4 范士雄;刘幸蔚;魏智慧;刘瑞叶;王松岩;于继来;;基于智能体群组强化学习的电网无功电压调控方法[J];电力工程技术;2020年02期
5 李想;杨梅;;人工智能体法律地位的审视——基于实质与形式要素之考量[J];济源职业技术学院学报;2020年02期
6 姚健奎;;打造城市智能体[J];中国建设信息化;2019年03期
7 大泽博隆;鲁翠;;人与智能体交互:与人相关的人工智能系统设计[J];装饰;2016年11期
8 刘筱;;一种自治智能体的实现方案[J];信息系统工程;2013年02期
9 万路军;姚佩阳;孙鹏;;有人/无人作战智能体分布式任务分配方法[J];系统工程与电子技术;2013年02期
10 潘晓英;焦李成;刘芳;;粒度智能体进化分类算法[J];电子学报;2009年03期
11 李伟;;智能体技术在现代导弹制导中的应用研究[J];战术导弹技术;2007年03期
12 辛润勤;罗荣桂;;智能体理论研究述评[J];科技进步与对策;2007年08期
中国重要会议论文全文数据库 前20条
1 景浩;;《类脑智能体伦理道德地位的前瞻性研究》[A];第十八届中国诚信企业家大会论文集[C];2022年
2 刘伟;武钰;;人-智能体协作系统的信任校准[A];2021年无人系统高峰论坛(USS 2021)论文集[C];2021年
3 陆启韶;;智能体系统的动力学与控制问题[A];第一届全国神经动力学学术会议程序手册 & 论文摘要集[C];2012年
4 陆启韶;;智能体系统的动力学与控制问题[A];第一届全国神经动力学学术会议程序手册 & 论文摘要集[C];2012年
5 王壮;李辉;李晓辉;沈凤;;基于深度强化学习的作战智能体研究[A];第六届中国指挥控制大会论文集(上册)[C];2018年
6 仵博;宁志宇;吴敏;;一种基于行为的双层动态智能体结构[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
7 孙铁利;杨永明;赵晶晶;;营救智能体的研究与开发[A];2005年全国理论计算机科学学术年会论文集[C];2005年
8 高晶英;徐旭;;具有动态网络的多智能体动态牵制蜂拥控制算法[A];第十届动力学与控制学术会议摘要集[C];2016年
9 曹江丽;;运行在非结构化环境下自主智能体的智能学习与控制[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(下册)[C];2006年
10 罗小元;刘丹;;基于势函数的多智能体群集与避障[A];第二十九届中国控制会议论文集[C];2010年
11 李思明;叶华文;;基于多虚拟领导者的多智能体群集编队[A];第26届中国控制与决策会议论文集[C];2014年
12 刘杰;王月海;王鸿雁;;基于反思——模仿的多智能体协作策略[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
13 贺晨龙;黄丽湘;张继业;;多车辆编队协作控制[A];第十一届全国非线性振动学术会议暨第八届全国非线性动力学和运动稳定性学术会议论文集[C];2007年
14 沈杰;梁志伟;刘娟;朱松豪;;RCRSS中的多警察智能体协作[A];第25届中国控制与决策会议论文集[C];2013年
15 任锐;王晓丽;周浔;;基于势函数的多智能体编队控制[A];中国仪器仪表学会第十二届青年学术会议论文集[C];2010年
16 肖晴;许维胜;吴启迪;;多智能体系统用于企业集成[A];1998年中国控制会议论文集[C];1998年
17 梁泉;许晓鸣;张钟俊;;多智能体系统智能体协作层的设计与实现[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
18 杨熙;王金枝;;多智能体系统一致性的鲁棒性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
19 张梦然;;“AI临床医生”学习智能体问世[A];《科学与现代化》2019年第1期(总第078期)[C];2019年
20 黄鸿;陈杰;崔立辉;李林;;BITwo中的MultiAgent协作[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
中国博士学位论文全文数据库 前20条
1 曾凡玉;基于深度强化学习的智能体导航研究[D];电子科技大学;2021年
2 黄利伟;智能协同算法研究及应用[D];电子科技大学;2019年
3 李哲;面向工业应用的智能体控制系统研究[D];西北工业大学;2017年
4 宿云;基于本体的智能体情感识别与情感诱发研究[D];兰州大学;2019年
5 张文旭;基于一致性与事件驱动的强化学习研究[D];西南交通大学;2018年
6 苏厚胜;多智能体蜂拥控制问题研究[D];上海交通大学;2008年
7 徐啟蕾;未知环境下移动智能体自主导航研究[D];中国海洋大学;2013年
8 吴正平;复杂网络建模与一致性及在多移动智能体中的应用[D];华中科技大学;2007年
9 吴锋;基于决策理论的多智能体系统规划问题研究[D];中国科学技术大学;2011年
10 张灵敏;智能体系统的稳定性分析及在多智能体一致性控制中的应用研究[D];燕山大学;2020年
11 吴元清;多智能体系统的鲁棒同步控制[D];浙江大学;2016年
12 王露;监督信号引导的强化学习及其应用[D];华东师范大学;2021年
13 石焕;功率驱动移动智能体网络的同步分析与控制[D];浙江大学;2011年
14 秦政;基于自主和自学习行为智能体的AUV运动规划研究[D];哈尔滨工程大学;2008年
15 张连新;基于多智能体技术的机器人遥控焊接系统研究[D];哈尔滨工业大学;2006年
16 李皎洁;具有部分感知能力的多智能体协同避障控制[D];上海交通大学;2015年
17 仵博;动态不确定环境下的智能体序贯决策方法及应用研究[D];中南大学;2013年
18 杜库;切换网络结构下多智能体系统的同步问题研究[D];中国科学技术大学;2021年
19 董娜;面向核环境管道维修的多智能体遥控焊接系统研究[D];哈尔滨工业大学;2010年
20 李存荣;产品制造信息中的知识发现及其应用研究[D];武汉理工大学;2006年
中国硕士学位论文全文数据库 前20条
1 黄宁馨;基于元学习和深度强化学习的智能体快速适应方法[D];扬州大学;2021年
2 贾倩雯;基于智能体的海上遇险目标搜索算法研究[D];海南大学;2019年
3 邓悟;基于深度强化学习的智能体避障与路径规划研究与应用[D];电子科技大学;2019年
4 董诗音;基于增强学习的智能体博弈问题研究[D];哈尔滨工业大学;2019年
5 袁野;基于近似投影的异步时间分布式优化算法的设计与研究[D];南京邮电大学;2019年
6 毛建博;基于虚拟自我对局的多人非完备信息机器博弈策略研究[D];哈尔滨工业大学;2018年
7 李明豪;基于深度强化学习的非完备信息3D视频游戏博弈算法研究[D];哈尔滨工业大学;2018年
8 胡丽娟;基于强化学习的2D仿真足球机器人协作机制[D];南京邮电大学;2019年
9 刘润之;多机器人对抗系统的策略研究[D];西安电子科技大学;2019年
10 黄思宇;深度强化学习在围捕逃逸问题中的应用研究[D];华中科技大学;2019年
11 聂小广;多种游戏场景下智能体深度强化学习方法研究[D];北京工业大学;2019年
12 单慧;基于神经调节机理的发育网络设计与应用[D];郑州大学;2019年
13 王征;人工智能体的法律主体地位研究[D];河北师范大学;2019年
14 吴悦晨;面向视觉感知与导航的深度强化学习算法研究与实现[D];山东大学;2019年
15 李建清;智能体的环境视觉感知与应用[D];山东大学;2018年
16 王耶利;基于A3C模型的带预判游戏智能体研究[D];哈尔滨工业大学;2018年
17 丁晶晶;信息受限下分布式多智能体优化算法设计与分析[D];南京邮电大学;2018年
18 喻杉;基于深度环境理解和行为模仿的强化学习智能体设计[D];浙江大学;2019年
19 杜娟娟;分布式自治智能体优化算法研究[D];中国石油大学;2009年
20 贾天旭;智能体路径规划与编队控制研究[D];燕山大学;2021年
中国重要报纸全文数据库 前20条
1 ;构建自进化城市智能体助力大湾区打造国际科创中心[N];21世纪经济报道;2021年
2 记者 张梦然;“自主智能体”能与人类辩论[N];科技日报;2021年
3 记者 栾吟之;“城市智能体”在沪发布[N];解放日报;2020年
4 记者 谈燕;让超大城市有机生命体成为“智能体”[N];解放日报;2021年
5 本报记者 华凌;AI能忆起昨天的你了 但触景生情还有点难[N];科技日报;2019年
6 本报记者 张心怡;云天励飞:从“AI打拐”到城市智能体[N];中国电子报;2021年
7 记者 金叶子;AI赋能城市数字化转型 打造超大城市“智能体”[N];第一财经日报;2021年
8 记者 张梦然;“AI临床医生”学习智能体问世[N];科技日报;2018年
9 本报见习记者 田瑞颖;机器人也能“换位思考”[N];中国科学报;2020年
10 记者 张梦然;神经网络打开理解电子相互作用新窗口[N];科技日报;2021年
11 记者 董映璧;神经网络技术检测玻璃钢缺陷精度高[N];科技日报;2020年
12 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
13 ;神经网络小史[N];电子报;2018年
14 ;人工智能将取得大面积突破[N];中国企业报;2017年
15 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
16 记者 刘霞;新神经网络使计算机像人一样推理[N];科技日报;2017年
17 本报记者 喻思娈;人工智能有多智能?[N];人民日报;2017年
18 ;人工智能到底有多智能?[N];长白山日报;2017年
19 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
20 记者 冯海波 通讯员 华轩;构建叠层宽度神经网络成深度模型[N];广东科技报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978