Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets
المؤلفون المشاركون
Zhang, Shengping
Feng, Xinjie
Yao, Hongxun
المصدر
العدد
المجلد 2019، العدد 2019 (31 ديسمبر/كانون الأول 2019)، ص ص. 1-11، 11ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2019-01-02
دولة النشر
مصر
عدد الصفحات
11
التخصصات الرئيسية
الملخص EN
In this paper, we propose a novel deep model for unbalanced distribution Character Recognition by employing focal loss based connectionist temporal classification (CTC) function.
Previous works utilize Traditional CTC to compute prediction losses.
However, some datasets may consist of extremely unbalanced samples, such as Chinese.
In other words, both training and testing sets contain large amounts of low-frequent samples.
The low-frequent samples have very limited influence on the model during training.
To solve this issue, we modify the traditional CTC by fusing focal loss with it and thus make the model attend to the low-frequent samples at training stage.
In order to demonstrate the advantage of the proposed method, we conduct experiments on two types of datasets: synthetic and real image sequence datasets.
The results on both datasets demonstrate that the proposed focal CTC loss function achieves desired performance on unbalanced datasets.
Specifically, our method outperforms traditional CTC by 3 to 9 percentages in accuracy on average.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Feng, Xinjie& Yao, Hongxun& Zhang, Shengping. 2019. Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets. Complexity،Vol. 2019, no. 2019, pp.1-11.
https://search.emarefa.net/detail/BIM-1133203
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Feng, Xinjie…[et al.]. Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets. Complexity No. 2019 (2019), pp.1-11.
https://search.emarefa.net/detail/BIM-1133203
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Feng, Xinjie& Yao, Hongxun& Zhang, Shengping. Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets. Complexity. 2019. Vol. 2019, no. 2019, pp.1-11.
https://search.emarefa.net/detail/BIM-1133203
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1133203
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر