收藏本站
《控制理论与应用》 2007年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于行为控制的两自由度机械臂智能控制器

叶剑  乔俊飞  李明爱  阮晓钢  
【摘要】:基于行为的控制方法相对于传统的控制方法在解决未知环境中的机器人中有着更好的鲁棒性和实时性.本文提出了一种基于反应式行为控制的智能控制器,以强化学习作为智能控制器的学习算法.通过采用评价-控制模型,该智能控制器能够不依赖于系统模型,通过连续地在线学习得到机器人的行为.将该智能控制器应用到两自由度仿真机械臂的控制中,仿真结果表明该智能控制器可以实现对两自由度机械臂的连续控制,使其能够迅速达到目标位置.

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 王义萍;陈庆伟;胡维礼;;机器人行为选择机制综述[J];机器人;2009年05期
2 凌睿;柴毅;;悬臂式掘进机器人截割臂建模与二阶滑模控制器设计[J];控制理论与应用;2010年08期
中国硕士学位论文全文数据库 前1条
1 徐忠;基于Profibus-DP的网络数控系统的研究与应用[D];浙江工业大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 郑宇;罗四维;吕子昂;;基于模型的层次化强化学习算法[J];北京交通大学学报;2006年05期
2 孙若莹;李忱;赵刚;;基于强化学习的牛鞭效应对策模型[J];北京信息科技大学学报(自然科学版);2011年01期
3 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期
4 刘向东;崔晓婷;王华;张宇河;;TD再励学习在卫星姿态控制中的应用[J];北京理工大学学报;2006年03期
5 毕金波,吴沧浦;有效的自适应λ即时差异学习(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期
6 王雪松,程玉虎,彭光正;Modeling and Simulation of Time Series Prediction Based on Dynamic Neural Network[J];Journal of Beijing Institute of Technology(English Edition);2004年02期
7 林海,孙吉贵;预测及其主要模型的实现系统[J];吉林大学学报(信息科学版);2002年04期
8 杨东,殷苌茗,陈焕文,吴柏森;基于Q-学习的非线性控制[J];长沙电力学院学报(自然科学版);2003年01期
9 殷苌茗,王汉兴,陈焕文,谢丽娟;基于有效跟踪的平均渐进瞬时差分学习遗忘算法(英文)[J];长沙电力学院学报(自然科学版);2003年04期
10 吕志来,张保会,哈恒旭;一种变结构的时间序列预测算法及其在电力系统暂态稳定预测中的应用[J];电工技术学报;2002年03期
中国重要会议论文全文数据库 前10条
1 陈泰任;曹卫华;吴敏;雷琪;;一种新的集成模型在焦炉火道温度软测量中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 ;Reinforcement Strategy Using Quantum Amplitude Amplification for Robot Learning[A];第二十六届中国控制会议论文集[C];2007年
3 ;Sample-Based Potentials Estimation for the Optimal Control of Stochastic System[A];中国自动化学会控制理论专业委员会D卷[C];2011年
4 郭成安;李建华;李明伟;;从观测数据学习后验概率函数:一种最佳神经网络模型的设计与分析[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
6 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
7 陈焕文;谢丽娟;谢建平;;TD方法与BP神经网络结合构造预测学习系统的算法分析与实现[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 王直杰;方建安;邵世煌;;一种增强式学习算法及其在控制中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
9 王珏;程然;王骄;;人工神经元网络结合TD(λ)算法在中国象棋机器博弈中的应用[A];2009中国控制与决策会议论文集(2)[C];2009年
10 ;An Adaptive Inventory Control for a Supply Chain[A];2009中国控制与决策会议论文集(3)[C];2009年
中国博士学位论文全文数据库 前10条
1 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
2 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
3 蔡军;家电产品市场营销研究[D];天津大学;2010年
4 李珺;基于强化学习的多机器人追捕问题研究[D];哈尔滨工业大学;2010年
5 徐一帆;天基海洋移动目标监视的联合调度问题研究[D];国防科学技术大学;2011年
6 董孟高;基于Agent的自适应系统运行机制及其构造技术研究[D];国防科学技术大学;2011年
7 李鑫;基于强化学习理论的网络拥塞控制算法研究[D];东北大学;2009年
8 金卓军;逆向增强学习和示教学习算法研究及其在智能机器人中的应用[D];浙江大学;2011年
9 张涛;非线性系统控制策略的研究[D];浙江大学;2001年
10 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 李志强;Q学习在单路口交通信号控制中的应用研究[D];长沙理工大学;2010年
2 柴雪霞;基于强化学习的Web服务组合优化研究[D];合肥工业大学;2011年
3 黄付亮;联合博弈框架下的多Agent强化学习算法研究[D];太原科技大学;2011年
4 方珍;基于Android平台的中国象棋设计与实现[D];电子科技大学;2011年
5 王明明;基于强化学习的机械臂控制研究[D];华中科技大学;2009年
6 修国明;实用POMDP近似求解算法的研究[D];哈尔滨工业大学;2009年
7 任建功;基于强化学习的自主式移动机器人导航控制[D];哈尔滨工业大学;2010年
8 李兆斌;自主移动机器人导航与控制中的增强学习方法研究[D];国防科学技术大学;2010年
9 宗露艳;强化学习和相关反馈在口腔正畸图像检索中的应用[D];江苏科技大学;2011年
10 赵俊杰;中高速单体船流体动力学性能和结构特性综合优化研究[D];江苏科技大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 雷艳敏;冯志彬;宋继红;;基于行为的多机器人编队控制的仿真研究[J];长春大学学报;2008年08期
2 孙宜标;杨雪;夏加宽;;基于二阶滑模的永磁直线同步电机的鲁棒速度控制[J];电工技术学报;2007年10期
3 刘美俊;;基于Profibus的水厂网络控制系统[J];低压电器;2007年15期
4 陆军;刘其端;朱齐丹;;基于嵌入式系统和CAN总线的检修机械臂控制系统[J];电子技术应用;2008年02期
5 易芸芸;杨公源;;基于PLC的立体仓库控制系统设计[J];仪器仪表用户;2008年05期
6 刘金龙,常越;基于CAN总线的高压激光电源远程控制系统[J];高电压技术;2005年07期
7 杨钢;王鹏飞;马俊朋;;Profibus现场总线通信技术及其应用研究[J];工业仪表与自动化装置;2007年04期
8 姚竹亭,王宪朝,郝玉杰,黄锐;现场总线PROFIBUS技术及应用[J];华北工学院学报;2001年03期
9 刘新宇,洪炳熔;Robot soccer action selection based on Qlearning[J];Journal of Harbin Institute of Technology;2001年03期
10 ;Development of a PC-based Open Architecture Software-CNC System[J];Chinese Journal of Aeronautics;2007年03期
中国重要会议论文全文数据库 前1条
1 柴毅;凌睿;;自主移动掘进机器人控制系统研究[A];第25届中国控制会议论文集(下册)[C];2006年
【二级引证文献】
中国期刊全文数据库 前4条
1 杨帆;刘士荣;董德国;;编队控制中的机器人行为与基于服务的运动行为结构设计[J];机器人;2012年01期
2 王玉友;陈俊杰;赵涓涓;;基于情绪与认知的人机交互中的情感决策研究[J];软件导刊;2012年04期
3 白云飞;;机器人发展关键问题研究[J];机械工程与自动化;2011年05期
4 赵涓涓;杨建峰;陈俊杰;王玉友;;基于情绪认知评价理论和Q-learning的人机交互中情感决策[J];太原理工大学学报;2012年06期
中国博士学位论文全文数据库 前5条
1 毛宇峰;水下机器人系统体系结构及避障控制技术研究[D];哈尔滨工程大学;2010年
2 孙立博;虚拟人群行为建模及仿真技术研究[D];天津大学;2012年
3 杨帆;多移动机器人编队控制与协作运输研究[D];华东理工大学;2011年
4 姜大鹏;多水下机器人协调控制技术研究[D];哈尔滨工程大学;2011年
5 张波涛;移动机械臂运动规划算法及其应用研究[D];华东理工大学;2012年
中国硕士学位论文全文数据库 前2条
1 邱实;服务机器人远程控制关键技术研究[D];哈尔滨工业大学;2010年
2 王玉友;基于情绪认知评价理论的人机交互中情感交互研究[D];太原理工大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 叶培德;循环水凉水塔风机智能控制器投用成功[J];广州化工;1996年02期
2 殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期
3 李建坤,徐政勋;PID数字控制仪表中微分作用的精确实现[J];中国仪器仪表;2002年05期
4 李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期
5 刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期
6 宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期
7 李卫军;伍明华;;基于单片机的新型燃油锅炉智能控制器[J];仪器仪表用户;2006年05期
8 何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期
9 穆伟力;林景栋;唐妍;刘勇;;路灯远程监控系统中智能控制器的设计研究[J];计算机技术与发展;2011年06期
10 姜玉宪;姜秀杰;张建洲;;变指令智能控制模式及其在预测拦截中的应用[J];自动化学报;1993年06期
中国重要会议论文全文数据库 前10条
1 林一松;方平;郑时雄;;制造业中基于DSP的嵌入式智能控制器[A];面向21世纪的生产工程——2001年“面向21世纪的生产工程”学术会议暨企业生产工程与产品创新专题研讨会论文集[C];2001年
2 陈培国;;低压万能式断路器用智能控制器[A];中国电工技术学会低压电器专业委员会第十一届学术年会论文集[C];2002年
3 郭晨;于静哲;孙增圻;叶榛;;自学习模糊CMAC智能控制器[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
4 赵豫斌;赵京伟;;家庭化智能控制器的硬件实现[A];第十届全国核电子学与核探测技术学术年会论文集[C];2000年
5 程玉标;朱建高;;新一代智能控制器的关键技术与采标情况[A];中国电工技术学会低压电器专业委员会第十一届学术年会论文集[C];2002年
6 杨启亮;邢建春;王平;;面向Agent的高压空压机智能控制器研究[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
7 郑昕;朱方铁;张培铭;曾明忠;;MC9S12DG128B在低压断路器智能控制器中的应用[A];中国电工技术学会低压电器专业委员会第十三届学术年会论文集[C];2007年
8 刘树鑫;曹云东;侯春光;刘晓明;;嵌入式系统在断路器智能控制中的应用[A];第一届电器装备及其智能化学术会议论文集[C];2007年
9 邢建春;吴龙宝;支开德;方忠华;仲未央;王平;;智能控制器在热电厂锅炉控制中的应用[A];1998年中国控制会议论文集[C];1998年
10 曾庆军;刘阳;金升福;黄巧亮;;一种基于CAN总线的低压断路器新型智能控制器研制[A];江苏省电工技术学会成立十周年庆典暨2004年学术年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 贵州 刘德友;实用的LD-65智能控制器[N];电子报;2002年
7 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
8 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
9 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
10 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
5 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
6 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
7 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
8 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
9 高赟;基于粗糙集的故障诊断和容错控制理论和方法研究[D];西安科技大学;2005年
10 祖丽楠;多机器人系统自主协作控制与强化学习研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
2 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
3 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
4 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
5 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
6 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
7 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
8 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
9 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
10 汪向利;基于多Agent的生产计划与调度系统研究与开发[D];浙江工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026