收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

无界报酬平均模型的MDP

刘克  
【摘要】:正 §1 介绍和假设我们所讨论的 MDP 是如下意义的五重组,{S,(A(i),i∈S),q,r,}.其中 S为系统的状态空间,其中元素表示状态,为一可列集。而i∈S,A(i)则表示系统处于状态 i 的可用行为集,假设 A(i)均具有限集。q 是转移律族,是时齐的。r 是报酬函数。是一可列稚的列向量,它的第 i 个分量定义为:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘建庸,刘克;平均模型的Bellman最优原理[J];科学通报;1989年15期
2 俞建;;关于Huard推广的一点注记[J];运筹学杂志;1986年02期
3 俞建;;关于Huard定理的推广[J];贵州工业大学学报(自然科学版);1987年01期
4 薛声家;;有关“数学规划的稳定性”的几个问题[J];广西大学学报(自然科学版);1980年02期
5 肖文圣;;中国形成世界制造中心的时间预测[J];科技管理研究;2005年11期
6 魏力仁,郭先平;非平稳MDP的平均模型——一般状态空间的情形[J];科学通报;1991年10期
7 金辉;;关于“数学规划的稳定性”的一个注记[J];数学理论与应用;1983年01期
8 王紫萍;;浅议数学建模的假设条件[J];数学学习与研究(教研版);2008年09期
9 梁■廷;;关于一类椭圆型Euler方程非凡解的存在性的一个注[J];数学理论与应用;1988年Z1期
10 吴兆熊;;在满足谱估计解卷积法的二个假设条件下的一个同态解卷积系统[J];西安交通大学学报;1985年01期
11 俞建;;一个抽象算法的收敛性定理[J];贵州工业大学学报(自然科学版);1989年03期
12 吴正文;;多因素线性模型在工程价款结算中的应用[J];安徽建筑;2006年06期
13 俞建;关于单降点到集映象族一般算法收敛性条件的改进[J];数学年刊A辑(中文版);1985年03期
14 俞建;;关于自反Banach空间中点到集映象簇的两个算法[J];贵州工业大学学报(自然科学版);1985年01期
15 熊允发;;当前公安应用数理统计中应注意的问题[J];中国人民公安大学学报(自然科学版);2009年04期
16 孙龙祥;关于二阶混合型方程的边值问题[J];复旦学报(自然科学版);1986年01期
17 胡奇英;;MDP中模型的转换——平均模型[J];西安电子科技大学学报;1991年01期
18 陈彦光;;地理学的模型建设及其选择标准——简析非欧几何学对地理学研究方法的影响[J];亚热带资源与环境学报;2008年04期
19 王勇;;CAPM的检验方法及假设条件研究[J];统计与信息论坛;2009年06期
20 周正中;;整函数复合增长性的一些关系[J];安徽师范大学学报(自然科学版);1987年01期
中国重要会议论文全文数据库 前10条
1 李梅霞;王长钰;刘茜;;带扰动项的FR共轭梯度法[A];2006年中国运筹学会数学规划分会代表会议暨第六届学术会议论文集[C];2006年
2 谢里阳;张静;;一般机械系统可靠性预测模型及相关问题[A];2010年全国机械行业可靠性技术学术交流会暨第四届可靠性工程分会第二次全体委员大会论文集[C];2010年
3 董晓永;陈家源;;船舶投资决策多目标与评价模型[A];2003中国控制与决策学术年会论文集[C];2003年
4 时瑛;魏法杰;;多产品动态本-量-利分析模型研究[A];2004年中国管理科学学术会议论文集[C];2004年
5 胡艳;周宗放;;关于确定最佳应收账款持有量的信用成本模型分析[A];中国企业运筹学学术交流大会论文集[C];2005年
6 陈晓红;张琦;;具不可预料违约风险的中小企业集合债券定价[A];第三届(2008)中国管理学年会论文集[C];2008年
7 钟根元;骆建文;周斌;;完全信息动态博弈下绕过反倾销的对外直接投资[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
8 林志炳;许保光;蔡晨;;基于消费者偏好的混合渠道模型分析[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
9 杜守强;陈元媛;田志远;;一族含参数共轭下降算法的全局收敛性[A];中国运筹学会第八届学术交流会论文集[C];2006年
10 侯学良;贺全龙;金维兴;;基于STACKELBERG模型的冲突事件互适性解[A];第八届中国管理科学学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 蒋咪娜;具阻尼的p-方程组解的渐近行为及最优衰减率[D];华中师范大学;2008年
2 魏立峰;随机最优控制相关的HJB方程及弱解研究[D];山东大学;2009年
3 杨璐;带有非线性边界条件的反应扩散方程解的长时间行为[D];兰州大学;2008年
4 李佳民;求解带平衡约束数学规划问题的组合同伦内点方法[D];吉林大学;2007年
5 韦明俊;确定与不确定Navier-Stokes方程中的一些问题[D];浙江大学;2009年
6 吴盼玉;非线性数学期望及倒向随机微分方程理论[D];山东大学;2012年
7 余玅妙;基于位相型过程的复杂随机系统研究[D];四川师范大学;2012年
8 崔玉军;非线性算子与微分方程边值问题的多解[D];山东大学;2006年
9 郭志明;临界点理论在时滞微分方程周期解的应用[D];中山大学;2001年
10 孙秀萍;互补问题的非内点光滑型算法研究[D];天津大学;2008年
中国硕士学位论文全文数据库 前10条
1 张琼芬;几类脉冲时滞微分方程解的渐近性[D];广西师范大学;2008年
2 刘雅荣;共轭积分方程组正解的多重性[D];太原理工大学;2008年
3 刘甲玉;两种新的非单调线搜索方法[D];郑州大学;2008年
4 田羿;带Navier边值条件的非齐次p-调和方程的多解性[D];华中师范大学;2009年
5 毛明清;覆盖型网络的关键设施识别问题研究[D];华中科技大学;2011年
6 陈新行;在强混合条件下自回归模型中误差密度估计的渐近性质[D];吉林大学;2011年
7 赵明;非标准条件下多水平模型的似然比检验[D];华中科技大学;2010年
8 程婷;基于联合库存管理策略的供应链库存优化研究[D];中南大学;2005年
9 李夏晨;非凸非线性规划双松弛内点方法[D];河北工业大学;2007年
10 郑峰;变利率情形下的连续Ohlson模型及实证研究[D];复旦大学;2009年
中国重要报纸全文数据库 前2条
1 华物期货董事长、安徽大学兼职教授 谌正平 安徽大学教授 佘传奇;VaR技术在股指期货风险管理中的运用[N];期货日报;2007年
2 国海证券研究所;时间序列模型预测3月CPI为—1.26%[N];上海证券报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978