A Version of the Euler Equation in Discounted Markov Decision Processes

المؤلفون المشاركون

Cruz-Suárez, H.
Zacarías-Espinoza, G.
Vázquez-Guevara, V.

المصدر

Journal of Applied Mathematics

العدد

المجلد 2012، العدد 2012 (31 ديسمبر/كانون الأول 2012)، ص ص. 1-16، 16ص.

الناشر

Hindawi Publishing Corporation

تاريخ النشر

2012-10-24

دولة النشر

مصر

عدد الصفحات

16

التخصصات الرئيسية

الرياضيات

الملخص EN

This paper deals with Markov decision processes (MDPs) on Euclidean spaces with an infinite horizon.

An approach to study this kind of MDPs is using the dynamic programming technique (DP).

Then the optimal value function is characterized through the value iteration functions.

The paper provides conditions that guarantee the convergence of maximizers of the value iteration functions to the optimal policy.

Then, using the Euler equation and an envelope formula, the optimal solution of the optimal control problem is obtained.

Finally, this theory is applied to a linear-quadratic control problem in order to find its optimal policy.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Cruz-Suárez, H.& Zacarías-Espinoza, G.& Vázquez-Guevara, V.. 2012. A Version of the Euler Equation in Discounted Markov Decision Processes. Journal of Applied Mathematics،Vol. 2012, no. 2012, pp.1-16.
https://search.emarefa.net/detail/BIM-992949

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Cruz-Suárez, H.…[et al.]. A Version of the Euler Equation in Discounted Markov Decision Processes. Journal of Applied Mathematics No. 2012 (2012), pp.1-16.
https://search.emarefa.net/detail/BIM-992949

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Cruz-Suárez, H.& Zacarías-Espinoza, G.& Vázquez-Guevara, V.. A Version of the Euler Equation in Discounted Markov Decision Processes. Journal of Applied Mathematics. 2012. Vol. 2012, no. 2012, pp.1-16.
https://search.emarefa.net/detail/BIM-992949

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references

رقم السجل

BIM-992949