收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

具无界递归报酬函数的非时齐马尔科夫决策规划

章芸  郭世贞  
【摘要】:研究一类具有无界递归报酬函数的非时齐马尔科夫决策模型,建立了模型的最优方程,证明了ε—最优马氏策略的存在性,给出了一个策略为最优及该模型存在最优策略的充要条件。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 刘克;;无界报酬平均模型的MDP[J];数学理论与应用;1985年01期
2 杨春巍;;用马尔科夫决策规划制定经济发展的最优决策[J];重庆建筑大学学报;1988年04期
3 杨春巍;Марков决策规划对商品经济发展的预测[J];重庆建筑大学学报;1989年01期
4 林元烈;连续时间折扣矩最优模型及其与离散时间拟折扣矩最优模型的关系——Q 矩阵族未必保守的情形[J];数学学报;1992年01期
5 陈峥;二步马氏折扣模型的最优策略[J];中国海洋大学学报(自然科学版);1993年01期
6 章芸;郭世贞;;具无界递归报酬函数的非时齐马尔科夫决策规划[J];昆明理工大学学报(理工版);1993年02期
7 郭世贞;章芸;;非齐时折扣马氏决策规划的方差最小最优策略[J];昆明理工大学学报(理工版);1993年05期
8 杨春巍;群体生灭的马尔科夫过程[J];重庆建筑大学学报;1994年02期
9 许永龙;机器更新决策规划中的强最优问题[J];天津师大学报(自然科学版);1994年04期
10 章芸,郭世贞;具无界递归向量值报酬函数的非时齐马尔科夫决策规划[J];昆明理工大学学报;1995年02期
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978