有限规划水平自适应Markov决策过程的参数决策
【摘要】:针对现有Markov决策过程自适应决策方法仅研究无限规划水平自适应决策的不足,提出了一种有限规划水平Markov决策过程自适应决策算法.算法的基本思想是运用Bayes理论对未知系统进行“学习”,并且在每次决策时以最大概率保证实际决策为最优决策.最后用仿真结果表明了算法的有效性.
|
|
|
|
1 |
樊正芳;;雷达系统自适应抗干扰能力的探讨[J];航天电子对抗;1992年03期 |
2 |
李江洪,韩正之;有限规划水平自适应Markov决策过程的参数决策[J];应用科学学报;2000年04期 |
3 |
李江洪,韩正之;马尔可夫决策过程自适应决策的进展[J];控制与决策;2001年01期 |
4 |
李江红,胡照文;一类Markov决策过程自适应决策的新方法[J];控制与决策;2001年04期 |
5 |
李琪林;陈宇;周明天;;基于CORBA的分布式系统自适应容错模型的研究[J];计算机科学;2002年03期 |
6 |
李允;熊光泽;;普及计算终端的自适应性技术研究[J];计算机科学;2002年05期 |
7 |
李允,罗蕾,熊光泽;面向普适计算的自适应技术研究[J];电子学报;2004年05期 |
8 |
周健,戴梅萼,余振建,付昊桓,邢丰;远程实时视频传输的自适应技术[J];清华大学学报(自然科学版);2004年07期 |
9 |
卢香清,谭迎军;有关多目标遗传算法的研究[J];南阳师范学院学报;2004年09期 |
10 |
赵林惠;戴亚平;付东梅;董芳艳;;基于危险模型的三级模块式入侵检测系统[J];计算机应用;2006年10期 |
|