التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي

Joint Authors

الطالب، غيداء عبد العزيز
النعمة، ماهر أحمد أنور
الطائي، رافدة حميد

Source

التربية و العلم : مجلة علمية للبحوث العلمية الأساسية

Issue

Vol. 23, Issue 4 (31 Dec. 2010), pp.130-141, 12 p.

Publisher

University of Mosul College of Education for Pure Science

Publication Date

2010-12-31

Country of Publication

Iraq

No. of Pages

12

Main Subjects

Languages & Comparative Literature

Topics

Abstract AR

يقترح هذا البحث طريقة إحصائية و تحليل مورفولوجي لتصحيح الكلمات العربية الخاطئة بوصفها وسيلة معالجة نهائية للكلمات العربية الناتجة من أنظمة التمييز الضوئي OCR.

يلحق بالبحث قواميس بالكلمات بهدف مقارنة الكلمة تحت المعالجة مع مطابقتها في القاموس.

يستخدم هذا البحث عدد من مصادر المعرفة ويعتمد خصائص اللغة العربية، طريقة إحصائية، تحليل مورفولوجي، فضلا عن البحث في القواميس لتحديد موقع الخطأ و تصحيحه.

تتوقف عملية تصحيح الأخطاء على نوع الخطأ المحتمل، و الذي يشمل القلب المكاني، و إبدال الحروف، و حذفها، و إضافتها الممكنة، و ذلك باستبدال الحروف المنقلبة بتلك التي تشابهها، و تعويض الحروف المحذوفة بتلك المسموح بها داخل سياق الكلمة، و هي الأخطاء الأكثر حدوثا في أنظمة التمييز الضوئي.

Abstract EN

In this research we propose a statistical method and morpho-lexical analysis for correcting Arabic words as a post processor for Arabic words output from OCR systems.

Dictionaries of words were built for the comparison to the attached word.

The present research uses multiple knowledge sources and basing on the Arabic language properties, statistical method, morpho-lexical analysis and dictionary look-up for error detection and correction.

Correction of errors in this research depends on the type of possible error, which can be: transposing two adjacent letters, rejection, replacing an incorrect letter, inserting a missing letter, substitution errors, which are most frequently committed by the OCR systems.

American Psychological Association (APA)

الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. 2010. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674

Modern Language Association (MLA)

الطالب، غيداء عبد العزيز....[و آخرون]. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 23، ع. 4 (2010)، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674

American Medical Association (AMA)

الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2010. مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674

Data Type

Journal Articles

Language

Arabic

Notes

يتضمن مراجع ببليوجرافية : ص. 140-141

Record ID

BIM-325674