Proposed recognition system based on 2d-discrete multiwavelet transform for features extraction of latin handwritten text

Author

Abd al-Rahim, Layth Ali

Source

Journal of Babylon University : Journal of Applied and Pure Sciences

Issue

Vol. 19, Issue 3 (30 Sep. 2011), pp.1069-1085, 17 p.

Publisher

University of Babylon

Publication Date

2011-09-30

Country of Publication

Iraq

No. of Pages

17

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

تمييز الكتابة اليدوية هي عملية ترجمة لما مكتوب من أحرف أو كلمات لنص مكتوب يدويا على ورقة ما إلى أحرف مطبوعة يمكن تنضديها و تحريرها.

لعملية التمييز هذه فائدة مهمة في عملية التخاطب أو التواصل بين الإنسان و الحاسوب و تساعد على إجراء العمليات المختلفة عليها.

هذه الورقة تقدم تصميم متكامل لنظام تمييز الكتابة اليدوية و المكتوبة مسبقا (Off-Line) و الذي يعتمد على تمييز الكتابة حرفا تلو الأخر دون الاعتماد على معرفة من الكاتب (writer independent).

لقد تم تصميم النظام لأنماط الخط اليدوي المنفصل و المختلط (المنفصل-المتصل) و مسئول عن تمييز الأحرف اللاتينية بأحرفها الكبيرة (A-Z) و الصغيرة (a-z).

المقترح يتكون من المراحل الأساسية لتكوين أي نظام تمييز للأشكال.

هذه المراحل هي مرحلة العمليات الابتدائية و مرحلة استخلاص الخصائص ثم مرحلة المقارنة و التصنيف و أخيرا مرحلة العمليات المتقدمة.

يتضمن العمل تصميما جديدا لعدد من المراحل المكونة للمرحلة الابتدائية كمرحلة إزالة التلوثات الموجودة على الورقة و مرحلة تعديل الميل الأفقي لأسطر النص المكتوب و كذلك تعديل الميل العمودي للأحرف المائلة بالإضافة لمرحلة تقسيم الكلمة الواحدة لمجموعة الحروف المكونة لها.

أظهرت التجارب التي أجربت على عدد من الكتابات اليدوية تنفيذا سريعا للعمليات و نتائج جيدة جدا و بدقة عالية.

يتضمن التصميم أيضا طريقة جديدة لاستخلاص الخصائص للحروف المراد تمييزها بالاعتماد على التحويل المويجي المتعدد الثنائي الأبعاد (Transform 2D-Discrete Multiwavelet).

مرحلة المقارنة و التصنيف تم تصميمها باستخدام (Minimum Distance Classifier) و المعتمد على (Euclidean Distance) و يتميز بسرعة أداءه.

التصميم أيضا يتضمن مرحلة عمليات ما بعد التمييز (Postprocessing) و التي مهمتها إجراء بعض التعديلات فيما يخص أنماط الحروف كونها بهيئاتها الكبيرة أم الصغيرة و ذلك بما يتناسب و موقعها داخل الكلمة أو الجملة.

Abstract EN

Off-line handwriting recognition is the task of determining what letters or words are present in handwritten text.

It is of significant benefit to man-machine communication and can assist in the automatic processing of handwritten documents.

It is a subtask of the Optical Character Recognition (OCR), whose domain can be machine-print only.

The introduced system is a character-based recognition and it is a writer independent system.

The recognition responsibility of the proposed system is for 52 character classes [uppercases (A-Z) and the lowercases (a-z)].

The suggested system includes the essential stages needed for most of the pattern recognition systems.

These stages are the preprocessing stage, the features extraction stage, the pattern matching and classification stage and the post processing stage.

The proposed method employs the Multiwavelet transform using multiresolution signal decomposition techniques working together with multiple neural networks using a learning vector quantization network as a powerful classifier.

The classification stage is designed by using a minimum distance classifier depending on Euclidean Distance which has a high speed performance.

The design also includes a modest post processing stage that makes a consistency between the recognized characters within the same word in relation to their upper and lower cases.

American Psychological Association (APA)

Abd al-Rahim, Layth Ali. 2011. Proposed recognition system based on 2d-discrete multiwavelet transform for features extraction of latin handwritten text. Journal of Babylon University : Journal of Applied and Pure Sciences،Vol. 19, no. 3, pp.1069-1085.
https://search.emarefa.net/detail/BIM-287966

Modern Language Association (MLA)

Abd al-Rahim, Layth Ali. Proposed recognition system based on 2d-discrete multiwavelet transform for features extraction of latin handwritten text. Journal of Babylon University : Journal of Applied and Pure Sciences Vol. 19, no. 3 (2011), pp.1069-1085.
https://search.emarefa.net/detail/BIM-287966

American Medical Association (AMA)

Abd al-Rahim, Layth Ali. Proposed recognition system based on 2d-discrete multiwavelet transform for features extraction of latin handwritten text. Journal of Babylon University : Journal of Applied and Pure Sciences. 2011. Vol. 19, no. 3, pp.1069-1085.
https://search.emarefa.net/detail/BIM-287966

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 1084-1085

Record ID

BIM-287966