Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM

Joint Authors

Safabakhsh, Rida
Adibi, Peyman

Source

The Arabian Journal for Science and Engineering. Section B, Engineering

Issue

Vol. 30, Issue 1B (30 Apr. 2005), pp.95-118, 24 p.

Publisher

King Fahd University of Petroleum and Minerals

Publication Date

2005-04-30

Country of Publication

Saudi Arabia

No. of Pages

24

Main Subjects

Electronic engineering

Abstract AR

سوف نقدم في هذا البحث نظاما كاملا للتعرف على كلمات (نستعليق الخطية الفارسية) باستخدام موديل ماركوف الخفي و تكاثف المشاهدات المستمرة و طول الحالات المتغيرة (CDVDHMM).

و في مرحلة التقديم المقدمة بعد عمليات باينري وإلغاء النويز و الحصول على الأجزاء المتصلة يتم استخدام خوارزمية جديدة لكشف الصاعد و الهابط و النقاط و سائر الأجزاء الثانوية و شطبها من التصوير الرئيسي.

ثم يتم تنفيذ خوارزمية تقطيع جديدة علي أساس تحليل كانتور العلوي و عمليتين مساعديتين.

و الغرض من هذه الخوارزمية هو أن لا تكون هناك قدر الإمكان مشكلة عدم التقطيع.

و قد تم تخصيص طول الحالات المتغيرة لإزالة التقطيع الزائد.

و بعد الحصول على الترتيب من اليمين إلى اليسار يتم إجراء موديل CDVDHMM بمؤخر الحروف التحتية الناتجة.

و الخصائص الثمانية التي تشتمل على تواصيف فورية الثلاثة و عدد الخصائص الأساسية التي تستخدم لعرض هذه الرموز في أجواء الخصائص.

و البعد الخصائصي بالنسبة لتغيير القياس غير المتغير.

إن الحالات في هذا النموذج تشتمل على أحرف خالصة (بدون أجزاء ثانوية) و عدة أشكال تركيبية في أسلوب الكتابة بالنستعليق.

و عليه فإن تعليم الموديل يتم بسهولة و دون الحاجة لأسلوب التقدير الثانوي.

و في مرحلة التعليم يتم الحصول على عدد من مكونات الموديل من مجموعة التصاوير التعليمية و الباقي من القاموس, و بالتالي يتم الحصول على نسخة خوارزمية و يتربي المعدلة للتعريف.

و تعطينا هذه الخوارزمية أفضل صورة لأكثر من مسار عام الذي يأخذ المواقع و الأشكال المختلفة للأحرف كحالات تحتية و يساند طول الحالات المتغيرة.

و قد تبيـن أن الاختبارات التي أجريت على نماذج خطية و قاموس ذات 50 كلمة, قدمت نتائج جيدة للأسلوب المستخدم.

Abstract EN

This paper introduces a complete system for recognition of Farsi Nastaaligh handwritten words using a continuous-density variable-duration hidden Markov model, CDVDHMM [1].

In preprocessing stage, after binarization, noise reduction, and connected component specification, new algorithms are applied to find and eliminate ascenders, descenders, dots, and other secondary strokes from the original image.

Then a new segmentation algorithm based on analyzing upper contour and two other processes is applied.

The main goal of this algorithm is to avoid the undersegmentation problem.

Considering variable duration states in the system allows covering the over-segmentation problem.

By finding the right-to-left order, the sequence of obtained sub-characters is modeled by the CDVDHMM.

Eight features, including three Fourier descriptors and five structural and discrete features, are applied to represent symbols in the feature space.

This feature vector is invariant to size and shift.

The states in the model are considered as pure characters (without secondary strokes) plus some compound forms of characters in Nastaaligh handwriting style.

Thus, training the model becomes simple and does not need any re-estimation method.

In the training stage, some parameters of the model are obtained from the training image set and the others from the dictionary.

At the last stage, a modified version of Viterbi algorithm is applied for recognition.

This algorithm provides more than one globally best path and considers different positions and forms of letters as sub-states and also supports variable duration states.

Experiments on handwritten samples and a 50-word dictionary show very good performance of the system.

American Psychological Association (APA)

Safabakhsh, Rida& Adibi, Peyman. 2005. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering،Vol. 30, no. 1B, pp.95-118.
https://search.emarefa.net/detail/BIM-360124

Modern Language Association (MLA)

Safabakhsh, Rida& Adibi, Peyman. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering Vol. 30, no. 1B (Apr. 2005), pp.95-118.
https://search.emarefa.net/detail/BIM-360124

American Medical Association (AMA)

Safabakhsh, Rida& Adibi, Peyman. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering. 2005. Vol. 30, no. 1B, pp.95-118.
https://search.emarefa.net/detail/BIM-360124

Data Type

Journal Articles

Language

English

Notes

31

Record ID

BIM-360124