Context Transfer in Reinforcement Learning Using Action-Value Functions
المؤلفون المشاركون
Araabi, Babak N.
Mousavi, Amin
Nili Ahmadabadi, Majid
المصدر
Computational Intelligence and Neuroscience
العدد
المجلد 2014، العدد 2014 (31 ديسمبر/كانون الأول 2014)، ص ص. 1-10، 10ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2014-12-30
دولة النشر
مصر
عدد الصفحات
10
التخصصات الرئيسية
الملخص EN
This paper discusses the notion of context transfer in reinforcement learning tasks.
Context transfer, as defined in this paper, implies knowledge transfer between source and target tasks that share the same environment dynamics and reward function but have different states or action spaces.
In other words, the agents learn the same task while using different sensors and actuators.
This requires the existence of an underlying common Markov decision process (MDP) to which all the agents’ MDPs can be mapped.
This is formulated in terms of the notion of MDP homomorphism.
The learning framework is Q -learning.
To transfer the knowledge between these tasks, the feature space is used as a translator and is expressed as a partial mapping between the state-action spaces of different tasks.
The Q -values learned during the learning process of the source tasks are mapped to the sets of Q -values for the target task.
These transferred Q -values are merged together and used to initialize the learning process of the target task.
An interval-based approach is used to represent and merge the knowledge of the source tasks.
Empirical results show that the transferred initialization can be beneficial to the learning process of the target task.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Mousavi, Amin& Araabi, Babak N.& Nili Ahmadabadi, Majid. 2014. Context Transfer in Reinforcement Learning Using Action-Value Functions. Computational Intelligence and Neuroscience،Vol. 2014, no. 2014, pp.1-10.
https://search.emarefa.net/detail/BIM-1034647
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Mousavi, Amin…[et al.]. Context Transfer in Reinforcement Learning Using Action-Value Functions. Computational Intelligence and Neuroscience No. 2014 (2014), pp.1-10.
https://search.emarefa.net/detail/BIM-1034647
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Mousavi, Amin& Araabi, Babak N.& Nili Ahmadabadi, Majid. Context Transfer in Reinforcement Learning Using Action-Value Functions. Computational Intelligence and Neuroscience. 2014. Vol. 2014, no. 2014, pp.1-10.
https://search.emarefa.net/detail/BIM-1034647
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1034647
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر