Software for Arabic machine printed optical character recognition (MACRS)‎

Joint Authors

al-Zubaydi, Lahib Muhammad
al-Ubaydi, Mahdi F.

Source

al- Rafidain Journal of Computer Sciences and Mathematics

Issue

Vol. 3, Issue 1 (30 Jun. 2006), pp.23-41, 19 p.

Publisher

University of Mosul College of Computer Science and Mathematics

Publication Date

2006-06-30

Country of Publication

Iraq

No. of Pages

19

Main Subjects

Information Technology and Computer Science

Abstract AR

Machine printed Arabic Character Recognition System (MACRS) نظام لتمييز الحروف العربية المطبوعة، في هذا العمل تم استخلاص خواص الحروف العربية المطبوعة باستخدام طريقة العزوم (Invariant (3 order) Geometric Moment).

أن تقنية MACRS تقسم إلى ثلاث خطوات رئيسية.

الخطوة الأولى هي المعالجة الأولية لتقسيم الوثيقة الصورية إلى مقاطع صورية أصغر تمثل كل منها حرفا و من ثم تنحيف صورة الحرف و اكتشاف انحراف صورة الحرف و تصححه.

الخطوة الثانية تمثل استخلاص الخواص حيث استخدمت طريقة العزوم في استخلاص الخواص حيث استخدمت طريقة العزوم في استخلاص الخواص للإدخالات، و أخيرا، استخدم نظام متقدم للتمييز و يشمل استخدام الشبكات العصبية الاصطناعية (Probablistic Neural Network) الذي يمنح سرعة مهمة في التمييز.

اختبر MACRS على 2961 تموذجا تمثل 141 حرفا عربيا تمثل الحروف (ا-ي)، ء، لا، ة) بمواقع الحرف العربي الأربعة و الأرقام (0-9) فضلا عن بعض الرموز (:، 0، [،]، !، =، /، *، -، +، ؟، ،) بواقع 21 نموذجا لكل حرف و قد لوحظ من خلال الاختبار أن النظام يقوم بالتمييز بنسبة تتراوح بين 84 % و 88 % على مجموعات الاختبار المختلفة، عموما يتراوح المعدل العام للتمييز بنسبة 85.8 % و هذا يعتبر أداء جيدا جدا كذلك فإن التمييز على معلومات التدريب تراوح مقداره 99.8 %.

Abstract EN

Machine printed Arabic Character Recognition System (MACRS] is concerned with recognition of machine printed alphanumeric Arabic characters.

In the present work, characters have been represented (extracted) by using geometric moment invariant (3 order).

The technique used in this research can be divided into three major steps.

The first step is digitization and preprocessing to create connected component, detect the skew of a character image and correct it.

The second is feature extraction, where geometric moment invariant features of the input, Arabic character are used to extract features.

Finally, we describe an advanced system of classification using probabilistic neural networks structure which yields significant speed improvements.

MACRS is tested using 2961 patterns for a total 141 classes with roughly 21 patterns in each class.

It is important to note here that the system performs extremely well with recognition rates ranging between 48 % and 88 % on different folds and the overall recognition is 85.8 %.

This is a very good performance taking into account the fact that we have a limited number of samples in each class and that, the recognition on the training data is also extremely high (99.8 %) which represents a very good training.

American Psychological Association (APA)

al-Ubaydi, Mahdi F.& al-Zubaydi, Lahib Muhammad. 2006. Software for Arabic machine printed optical character recognition (MACRS). al- Rafidain Journal of Computer Sciences and Mathematics،Vol. 3, no. 1, pp.23-41.
https://search.emarefa.net/detail/BIM-348962

Modern Language Association (MLA)

al-Ubaydi, Mahdi F.& al-Zubaydi, Lahib Muhammad. Software for Arabic machine printed optical character recognition (MACRS). al- Rafidain Journal of Computer Sciences and Mathematics Vol. 3, no. 1 (2006), pp.23-41.
https://search.emarefa.net/detail/BIM-348962

American Medical Association (AMA)

al-Ubaydi, Mahdi F.& al-Zubaydi, Lahib Muhammad. Software for Arabic machine printed optical character recognition (MACRS). al- Rafidain Journal of Computer Sciences and Mathematics. 2006. Vol. 3, no. 1, pp.23-41.
https://search.emarefa.net/detail/BIM-348962

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 41

Record ID

BIM-348962