作 者: ;
机构地区: 深圳大学理学院
出 处: 《数学研究》 1998年第3期312-318,共7页
摘 要: 本文讨论半马氏环境连续时间马氏决策过程中的平均准则.首先讨论了半马氏报酬过程中的逼近问题,进而讨论平均目标函数逼近问题。 This paper discusses the continuous time Markov decision processes in a semi-Markov environment with the average criterion. First, the approximation problems in a semi-Matkov reward process are studied, which is then used to discuss the approximation of the average objective functions.