Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM

المؤلفون المشاركون

Safabakhsh, Rida
Adibi, Peyman

المصدر

The Arabian Journal for Science and Engineering. Section B, Engineering

العدد

المجلد 30، العدد 1B (30 إبريل/نيسان 2005)، ص ص. 95-118، 24ص.

الناشر

جامعة الملك فهد للبترول و المعادن

تاريخ النشر

2005-04-30

دولة النشر

السعودية

عدد الصفحات

24

التخصصات الرئيسية

الهندسة الكهربائية

الملخص AR

سوف نقدم في هذا البحث نظاما كاملا للتعرف على كلمات (نستعليق الخطية الفارسية) باستخدام موديل ماركوف الخفي و تكاثف المشاهدات المستمرة و طول الحالات المتغيرة (CDVDHMM).

و في مرحلة التقديم المقدمة بعد عمليات باينري وإلغاء النويز و الحصول على الأجزاء المتصلة يتم استخدام خوارزمية جديدة لكشف الصاعد و الهابط و النقاط و سائر الأجزاء الثانوية و شطبها من التصوير الرئيسي.

ثم يتم تنفيذ خوارزمية تقطيع جديدة علي أساس تحليل كانتور العلوي و عمليتين مساعديتين.

و الغرض من هذه الخوارزمية هو أن لا تكون هناك قدر الإمكان مشكلة عدم التقطيع.

و قد تم تخصيص طول الحالات المتغيرة لإزالة التقطيع الزائد.

و بعد الحصول على الترتيب من اليمين إلى اليسار يتم إجراء موديل CDVDHMM بمؤخر الحروف التحتية الناتجة.

و الخصائص الثمانية التي تشتمل على تواصيف فورية الثلاثة و عدد الخصائص الأساسية التي تستخدم لعرض هذه الرموز في أجواء الخصائص.

و البعد الخصائصي بالنسبة لتغيير القياس غير المتغير.

إن الحالات في هذا النموذج تشتمل على أحرف خالصة (بدون أجزاء ثانوية) و عدة أشكال تركيبية في أسلوب الكتابة بالنستعليق.

و عليه فإن تعليم الموديل يتم بسهولة و دون الحاجة لأسلوب التقدير الثانوي.

و في مرحلة التعليم يتم الحصول على عدد من مكونات الموديل من مجموعة التصاوير التعليمية و الباقي من القاموس, و بالتالي يتم الحصول على نسخة خوارزمية و يتربي المعدلة للتعريف.

و تعطينا هذه الخوارزمية أفضل صورة لأكثر من مسار عام الذي يأخذ المواقع و الأشكال المختلفة للأحرف كحالات تحتية و يساند طول الحالات المتغيرة.

و قد تبيـن أن الاختبارات التي أجريت على نماذج خطية و قاموس ذات 50 كلمة, قدمت نتائج جيدة للأسلوب المستخدم.

الملخص EN

This paper introduces a complete system for recognition of Farsi Nastaaligh handwritten words using a continuous-density variable-duration hidden Markov model, CDVDHMM [1].

In preprocessing stage, after binarization, noise reduction, and connected component specification, new algorithms are applied to find and eliminate ascenders, descenders, dots, and other secondary strokes from the original image.

Then a new segmentation algorithm based on analyzing upper contour and two other processes is applied.

The main goal of this algorithm is to avoid the undersegmentation problem.

Considering variable duration states in the system allows covering the over-segmentation problem.

By finding the right-to-left order, the sequence of obtained sub-characters is modeled by the CDVDHMM.

Eight features, including three Fourier descriptors and five structural and discrete features, are applied to represent symbols in the feature space.

This feature vector is invariant to size and shift.

The states in the model are considered as pure characters (without secondary strokes) plus some compound forms of characters in Nastaaligh handwriting style.

Thus, training the model becomes simple and does not need any re-estimation method.

In the training stage, some parameters of the model are obtained from the training image set and the others from the dictionary.

At the last stage, a modified version of Viterbi algorithm is applied for recognition.

This algorithm provides more than one globally best path and considers different positions and forms of letters as sub-states and also supports variable duration states.

Experiments on handwritten samples and a 50-word dictionary show very good performance of the system.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Safabakhsh, Rida& Adibi, Peyman. 2005. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering،Vol. 30, no. 1B, pp.95-118.
https://search.emarefa.net/detail/BIM-360124

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Safabakhsh, Rida& Adibi, Peyman. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering Vol. 30, no. 1B (Apr. 2005), pp.95-118.
https://search.emarefa.net/detail/BIM-360124

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Safabakhsh, Rida& Adibi, Peyman. Nastaaligh handwritten word recognition using a continuous-density variable-duration HMM. The Arabian Journal for Science and Engineering. Section B, Engineering. 2005. Vol. 30, no. 1B, pp.95-118.
https://search.emarefa.net/detail/BIM-360124

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

31

رقم السجل

BIM-360124