![](/images/graphics-bg.png)
Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish Spaces
المؤلفون المشاركون
Zhu, Quanxin
Huang, Chuangxia
Yang, Xinsong
المصدر
العدد
المجلد 2009، العدد 2009 (31 ديسمبر/كانون الأول 2009)، ص ص. 1-17، 17ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2010-01-27
دولة النشر
مصر
عدد الصفحات
17
التخصصات الرئيسية
الملخص EN
We study the policy iteration algorithm (PIA) for continuous-time jump Markov decision processes in general state and action spaces.
The corresponding transition rates are allowed to be unbounded, and the reward rates may have neither upper nor lower bounds.
The criterion that we are concerned with is expected average reward.
We propose a set of conditions under which we first establish the average reward optimality equation and present the PIA.
Then under two slightly different sets of conditions we show that the PIA yields the optimal (maximum) reward, an average optimal stationary policy, and a solution to the average reward optimality equation.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Zhu, Quanxin& Yang, Xinsong& Huang, Chuangxia. 2010. Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish Spaces. Abstract and Applied Analysis،Vol. 2009, no. 2009, pp.1-17.
https://search.emarefa.net/detail/BIM-446602
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Zhu, Quanxin…[et al.]. Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish Spaces. Abstract and Applied Analysis No. 2009 (2009), pp.1-17.
https://search.emarefa.net/detail/BIM-446602
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Zhu, Quanxin& Yang, Xinsong& Huang, Chuangxia. Policy Iteration for Continuous-Time Average Reward Markov Decision Processes in Polish Spaces. Abstract and Applied Analysis. 2010. Vol. 2009, no. 2009, pp.1-17.
https://search.emarefa.net/detail/BIM-446602
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-446602
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
![](/images/ebook-kashef.png)
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر
![](/images/kashef-image.png)