Combining Multiple Strategies for Multiarmed Bandit Problems and Asymptotic Optimality

المؤلفون المشاركون

Choe, Sanghee
Chang, Hyeong Soo

المصدر

Journal of Control Science and Engineering

العدد

المجلد 2015، العدد 2015 (31 ديسمبر/كانون الأول 2015)، ص ص. 1-7، 7ص.

الناشر

Hindawi Publishing Corporation

تاريخ النشر

2015-03-25

دولة النشر

مصر

عدد الصفحات

7

التخصصات الرئيسية

هندسة كهربائية
تكنولوجيا المعلومات وعلم الحاسوب

الملخص EN

This brief paper provides a simple algorithm that selects a strategy at each time in a given set of multiple strategies for stochastic multiarmed bandit problems, thereby playing the arm by the chosen strategy at each time.

The algorithm follows the idea of the probabilistic ϵ t -switching in the ϵ t -greedy strategy and is asymptotically optimal in the sense that the selected strategy converges to the best in the set under some conditions on the strategies in the set and the sequence of { ϵ t } .

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Chang, Hyeong Soo& Choe, Sanghee. 2015. Combining Multiple Strategies for Multiarmed Bandit Problems and Asymptotic Optimality. Journal of Control Science and Engineering،Vol. 2015, no. 2015, pp.1-7.
https://search.emarefa.net/detail/BIM-1067760

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Chang, Hyeong Soo& Choe, Sanghee. Combining Multiple Strategies for Multiarmed Bandit Problems and Asymptotic Optimality. Journal of Control Science and Engineering No. 2015 (2015), pp.1-7.
https://search.emarefa.net/detail/BIM-1067760

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Chang, Hyeong Soo& Choe, Sanghee. Combining Multiple Strategies for Multiarmed Bandit Problems and Asymptotic Optimality. Journal of Control Science and Engineering. 2015. Vol. 2015, no. 2015, pp.1-7.
https://search.emarefa.net/detail/BIM-1067760

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references

رقم السجل

BIM-1067760