导 师: 戴永隆;郭先平
授予学位: 博士
作 者: ;
机构地区: 中山大学
摘 要: 本篇博士论文对离散时间马氏决策过程(DISCRETE-TIMEMARKOVDECISIONPROCESSES,简记为DTMDP)的一系列问题做了进一步的研究.这些问题主要包括:(1)可数状态上极限和下极限两种平均准则下的最优性问题.(2)一般状态空间中的平均最优平稳策略的存在性条件,值迭代算法以及最优策略的性质.(3)一般状态空间中的平均样本轨道最优性问题.(4)一般状态空间中的方差最优性问题.(5)一般状态空间中的强N(N=-1,0)-折扣最优性问题.本文用新方法所得结果推广了已有文献中相应的结论,并且可应用于以前所不能处理的若干情形.此外,还通过库存系统和受控的排队系统等一些实例,说明了相应条件和结果的应用.全文共分为七章. 第一章为综述,简要地介绍了马氏决策过程的历史背景,研究内容,发展现状以及本文所做的主要工作. 第二章讨论了可数状态上极限和下极限两种平均准则下的最优性问题.我们给出了一组新的最优性条件,并在此条件下保证存在既是上极限又是下极限平均最优平稳策略.而且,本章的条件和结果被应用到一个允许控制的排队模型. 第三章讨论了BOREL状态空间中的平均最优性问题. 第四章讨论了BOREL状态空间中的平均期望费用的值迭代问题。 第五章讨论了BOREL状态空间中的平均样本轨道最优性问题. 第六章讨论了BOREL状态空间中的方差最优性问题. 第七章讨论了BOREL状态空间中的强N(N=-1,0)-折扣最优性问题.
关 键 词: 离散时间马氏过程 最优平稳策略 值迭代算法 平均准则 方差准则
分 类 号: [O211.6]