![](/images/graphics-bg.png)
A Sarsa(λ) Algorithm Based on Double-Layer Fuzzy Reasoning
المؤلفون المشاركون
Liu, Quan
Mu, Xiang
Huang, Wei
Fu, Qiming
Zhang, Yonggang
المصدر
Mathematical Problems in Engineering
العدد
المجلد 2013، العدد 2013 (31 ديسمبر/كانون الأول 2013)، ص ص. 1-9، 9ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2013-12-05
دولة النشر
مصر
عدد الصفحات
9
التخصصات الرئيسية
الملخص EN
Solving reinforcement learning problems in continuous space with function approximation is currently a research hotspot of machine learning.
When dealing with the continuous space problems, the classic Q-iteration algorithms based on lookup table or function approximation converge slowly and are difficult to derive a continuous policy.
To overcome the above weaknesses, we propose an algorithm named DFR-Sarsa(λ) based on double-layer fuzzy reasoning and prove its convergence.
In this algorithm, the first reasoning layer uses fuzzy sets of state to compute continuous actions; the second reasoning layer uses fuzzy sets of action to compute the components of Q-value.
Then, these two fuzzy layers are combined to compute the Q-value function of continuous action space.
Besides, this algorithm utilizes the membership degrees of activation rules in the two fuzzy reasoning layers to update the eligibility traces.
Applying DFR-Sarsa(λ) to the Mountain Car and Cart-pole Balancing problems, experimental results show that the algorithm not only can be used to get a continuous action policy, but also has a better convergence performance.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Liu, Quan& Mu, Xiang& Huang, Wei& Fu, Qiming& Zhang, Yonggang. 2013. A Sarsa(λ) Algorithm Based on Double-Layer Fuzzy Reasoning. Mathematical Problems in Engineering،Vol. 2013, no. 2013, pp.1-9.
https://search.emarefa.net/detail/BIM-1009823
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Liu, Quan…[et al.]. A Sarsa(λ) Algorithm Based on Double-Layer Fuzzy Reasoning. Mathematical Problems in Engineering No. 2013 (2013), pp.1-9.
https://search.emarefa.net/detail/BIM-1009823
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Liu, Quan& Mu, Xiang& Huang, Wei& Fu, Qiming& Zhang, Yonggang. A Sarsa(λ) Algorithm Based on Double-Layer Fuzzy Reasoning. Mathematical Problems in Engineering. 2013. Vol. 2013, no. 2013, pp.1-9.
https://search.emarefa.net/detail/BIM-1009823
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1009823
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
![](/images/ebook-kashef.png)
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر
![](/images/kashef-image.png)