![](/images/graphics-bg.png)
Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM
Joint Authors
Source
The Arabian Journal for Science and Engineering. Section B, Engineering
Issue
Vol. 30, Issue 1B (30 Apr. 2005), pp.95-118, 24 p.
Publisher
King Fahd University of Petroleum and Minerals
Publication Date
2005-04-30
Country of Publication
Saudi Arabia
No. of Pages
24
Main Subjects
Abstract AR
سوف نقدم في هذا البحث نظاما كاملا للتعرف على كلمات (نستعليق الخطية الفارسية) باستخدام موديل ماركوف الخفي و تكاثف المشاهدات المستمرة و طول الحالات المتغيرة (CDVDHMM).
و في مرحلة التقديم المقدمة بعد عمليات باينري وإلغاء النويز و الحصول على الأجزاء المتصلة يتم استخدام خوارزمية جديدة لكشف الصاعد و الهابط و النقاط و سائر الأجزاء الثانوية و شطبها من التصوير الرئيسي.
ثم يتم تنفيذ خوارزمية تقطيع جديدة علي أساس تحليل كانتور العلوي و عمليتين مساعديتين.
و الغرض من هذه الخوارزمية هو أن لا تكون هناك قدر الإمكان مشكلة عدم التقطيع.
و قد تم تخصيص طول الحالات المتغيرة لإزالة التقطيع الزائد.
و بعد الحصول على الترتيب من اليمين إلى اليسار يتم إجراء موديل CDVDHMM بمؤخر الحروف التحتية الناتجة.
و الخصائص الثمانية التي تشتمل على تواصيف فورية الثلاثة و عدد الخصائص الأساسية التي تستخدم لعرض هذه الرموز في أجواء الخصائص.
و البعد الخصائصي بالنسبة لتغيير القياس غير المتغير.
إن الحالات في هذا النموذج تشتمل على أحرف خالصة (بدون أجزاء ثانوية) و عدة أشكال تركيبية في أسلوب الكتابة بالنستعليق.
و عليه فإن تعليم الموديل يتم بسهولة و دون الحاجة لأسلوب التقدير الثانوي.
و في مرحلة التعليم يتم الحصول على عدد من مكونات الموديل من مجموعة التصاوير التعليمية و الباقي من القاموس, و بالتالي يتم الحصول على نسخة خوارزمية و يتربي المعدلة للتعريف.
و تعطينا هذه الخوارزمية أفضل صورة لأكثر من مسار عام الذي يأخذ المواقع و الأشكال المختلفة للأحرف كحالات تحتية و يساند طول الحالات المتغيرة.
و قد تبيـن أن الاختبارات التي أجريت على نماذج خطية و قاموس ذات 50 كلمة, قدمت نتائج جيدة للأسلوب المستخدم.
Abstract EN
This paper introduces a complete system for recognition of Farsi Nastaaligh handwritten words using a continuous-density variable-duration hidden Markov model, CDVDHMM [1].
In preprocessing stage, after binarization, noise reduction, and connected component specification, new algorithms are applied to find and eliminate ascenders, descenders, dots, and other secondary strokes from the original image.
Then a new segmentation algorithm based on analyzing upper contour and two other processes is applied.
The main goal of this algorithm is to avoid the undersegmentation problem.
Considering variable duration states in the system allows covering the over-segmentation problem.
By finding the right-to-left order, the sequence of obtained sub-characters is modeled by the CDVDHMM.
Eight features, including three Fourier descriptors and five structural and discrete features, are applied to represent symbols in the feature space.
This feature vector is invariant to size and shift.
The states in the model are considered as pure characters (without secondary strokes) plus some compound forms of characters in Nastaaligh handwriting style.
Thus, training the model becomes simple and does not need any re-estimation method.
In the training stage, some parameters of the model are obtained from the training image set and the others from the dictionary.
At the last stage, a modified version of Viterbi algorithm is applied for recognition.
This algorithm provides more than one globally best path and considers different positions and forms of letters as sub-states and also supports variable duration states.
Experiments on handwritten samples and a 50-word dictionary show very good performance of the system.
American Psychological Association (APA)
Safabakhsh, Rida& Adibi, Peyman. 2005. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering،Vol. 30, no. 1B, pp.95-118.
https://search.emarefa.net/detail/BIM-360124
Modern Language Association (MLA)
Safabakhsh, Rida& Adibi, Peyman. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering Vol. 30, no. 1B (Apr. 2005), pp.95-118.
https://search.emarefa.net/detail/BIM-360124
American Medical Association (AMA)
Safabakhsh, Rida& Adibi, Peyman. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering. 2005. Vol. 30, no. 1B, pp.95-118.
https://search.emarefa.net/detail/BIM-360124
Data Type
Journal Articles
Language
English
Notes
31
Record ID
BIM-360124