Software for Arabic machine printed optical character recognition (MACRS)‎

المؤلفون المشاركون

al-Zubaydi, Lahib Muhammad
al-Ubaydi, Mahdi F.

المصدر

al- Rafidain Journal of Computer Sciences and Mathematics

العدد

المجلد 3، العدد 1 (30 يونيو/حزيران 2006)، ص ص. 23-41، 19ص.

الناشر

جامعة الموصل كلية علوم الحاسبات و الرياضيات

تاريخ النشر

2006-06-30

دولة النشر

العراق

عدد الصفحات

19

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الملخص AR

Machine printed Arabic Character Recognition System (MACRS) نظام لتمييز الحروف العربية المطبوعة، في هذا العمل تم استخلاص خواص الحروف العربية المطبوعة باستخدام طريقة العزوم (Invariant (3 order) Geometric Moment).

أن تقنية MACRS تقسم إلى ثلاث خطوات رئيسية.

الخطوة الأولى هي المعالجة الأولية لتقسيم الوثيقة الصورية إلى مقاطع صورية أصغر تمثل كل منها حرفا و من ثم تنحيف صورة الحرف و اكتشاف انحراف صورة الحرف و تصححه.

الخطوة الثانية تمثل استخلاص الخواص حيث استخدمت طريقة العزوم في استخلاص الخواص حيث استخدمت طريقة العزوم في استخلاص الخواص للإدخالات، و أخيرا، استخدم نظام متقدم للتمييز و يشمل استخدام الشبكات العصبية الاصطناعية (Probablistic Neural Network) الذي يمنح سرعة مهمة في التمييز.

اختبر MACRS على 2961 تموذجا تمثل 141 حرفا عربيا تمثل الحروف (ا-ي)، ء، لا، ة) بمواقع الحرف العربي الأربعة و الأرقام (0-9) فضلا عن بعض الرموز (:، 0، [،]، !، =، /، *، -، +، ؟، ،) بواقع 21 نموذجا لكل حرف و قد لوحظ من خلال الاختبار أن النظام يقوم بالتمييز بنسبة تتراوح بين 84 % و 88 % على مجموعات الاختبار المختلفة، عموما يتراوح المعدل العام للتمييز بنسبة 85.8 % و هذا يعتبر أداء جيدا جدا كذلك فإن التمييز على معلومات التدريب تراوح مقداره 99.8 %.

الملخص EN

Machine printed Arabic Character Recognition System (MACRS] is concerned with recognition of machine printed alphanumeric Arabic characters.

In the present work, characters have been represented (extracted) by using geometric moment invariant (3 order).

The technique used in this research can be divided into three major steps.

The first step is digitization and preprocessing to create connected component, detect the skew of a character image and correct it.

The second is feature extraction, where geometric moment invariant features of the input, Arabic character are used to extract features.

Finally, we describe an advanced system of classification using probabilistic neural networks structure which yields significant speed improvements.

MACRS is tested using 2961 patterns for a total 141 classes with roughly 21 patterns in each class.

It is important to note here that the system performs extremely well with recognition rates ranging between 48 % and 88 % on different folds and the overall recognition is 85.8 %.

This is a very good performance taking into account the fact that we have a limited number of samples in each class and that, the recognition on the training data is also extremely high (99.8 %) which represents a very good training.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

al-Ubaydi, Mahdi F.& al-Zubaydi, Lahib Muhammad. 2006. Software for Arabic machine printed optical character recognition (MACRS). al- Rafidain Journal of Computer Sciences and Mathematics،Vol. 3, no. 1, pp.23-41.
https://search.emarefa.net/detail/BIM-348962

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

al-Ubaydi, Mahdi F.& al-Zubaydi, Lahib Muhammad. Software for Arabic machine printed optical character recognition (MACRS). al- Rafidain Journal of Computer Sciences and Mathematics Vol. 3, no. 1 (2006), pp.23-41.
https://search.emarefa.net/detail/BIM-348962

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

al-Ubaydi, Mahdi F.& al-Zubaydi, Lahib Muhammad. Software for Arabic machine printed optical character recognition (MACRS). al- Rafidain Journal of Computer Sciences and Mathematics. 2006. Vol. 3, no. 1, pp.23-41.
https://search.emarefa.net/detail/BIM-348962

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 41

رقم السجل

BIM-348962