文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

离散时间马氏过程的最优控制——新的最优性条件和新的方法

收藏

导　　师： 戴永隆;郭先平

授予学位： 博士

作　　者： ;

机构地区： 中山大学

摘　　要： 本篇博士论文对离散时间马氏决策过程(DISCRETE-TIMEMARKOVDECISIONPROCESSES，简记为DTMDP)的一系列问题做了进一步的研究.这些问题主要包括：(1)可数状态上极限和下极限两种平均准则下的最优性问题.(2)一般状态空间中的平均最优平稳策略的存在性条件，值迭代算法以及最优策略的性质.(3)一般状态空间中的平均样本轨道最优性问题.(4)一般状态空间中的方差最优性问题.(5)一般状态空间中的强N(N=-1，0)-折扣最优性问题.本文用新方法所得结果推广了已有文献中相应的结论，并且可应用于以前所不能处理的若干情形.此外，还通过库存系统和受控的排队系统等一些实例，说明了相应条件和结果的应用.全文共分为七章. 　　第一章为综述，简要地介绍了马氏决策过程的历史背景，研究内容，发展现状以及本文所做的主要工作. 　　第二章讨论了可数状态上极限和下极限两种平均准则下的最优性问题.我们给出了一组新的最优性条件，并在此条件下保证存在既是上极限又是下极限平均最优平稳策略.而且，本章的条件和结果被应用到一个允许控制的排队模型. 　　第三章讨论了BOREL状态空间中的平均最优性问题. 第四章讨论了BOREL状态空间中的平均期望费用的值迭代问题。　　第五章讨论了BOREL状态空间中的平均样本轨道最优性问题. 　　第六章讨论了BOREL状态空间中的方差最优性问题. 　　第七章讨论了BOREL状态空间中的强N(N=-1，0)-折扣最优性问题.

关键词： 离散时间马氏过程最优平稳策略值迭代算法平均准则方差准则

分类号： [O211.6]

领　　域： [理学] [理学]

离散时间马氏过程的最优控制——新的最优性条件和新的方法

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

离散时间马氏过程的最优控制——新的最优性条件和新的方法

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+