التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي

المؤلفون المشاركون

الطالب، غيداء عبد العزيز
النعمة، ماهر أحمد أنور
الطائي، رافدة حميد

المصدر

التربية و العلم : مجلة علمية للبحوث العلمية الأساسية

العدد

المجلد 23، العدد 4 (31 ديسمبر/كانون الأول 2010)، ص ص. 130-141، 12ص.

الناشر

جامعة الموصل كلية التربية للعلوم الصرفة

تاريخ النشر

2010-12-31

دولة النشر

العراق

عدد الصفحات

12

التخصصات الرئيسية

اللغات والآداب المقارنة

الموضوعات

الملخص AR

يقترح هذا البحث طريقة إحصائية و تحليل مورفولوجي لتصحيح الكلمات العربية الخاطئة بوصفها وسيلة معالجة نهائية للكلمات العربية الناتجة من أنظمة التمييز الضوئي OCR.

يلحق بالبحث قواميس بالكلمات بهدف مقارنة الكلمة تحت المعالجة مع مطابقتها في القاموس.

يستخدم هذا البحث عدد من مصادر المعرفة ويعتمد خصائص اللغة العربية، طريقة إحصائية، تحليل مورفولوجي، فضلا عن البحث في القواميس لتحديد موقع الخطأ و تصحيحه.

تتوقف عملية تصحيح الأخطاء على نوع الخطأ المحتمل، و الذي يشمل القلب المكاني، و إبدال الحروف، و حذفها، و إضافتها الممكنة، و ذلك باستبدال الحروف المنقلبة بتلك التي تشابهها، و تعويض الحروف المحذوفة بتلك المسموح بها داخل سياق الكلمة، و هي الأخطاء الأكثر حدوثا في أنظمة التمييز الضوئي.

الملخص EN

In this research we propose a statistical method and morpho-lexical analysis for correcting Arabic words as a post processor for Arabic words output from OCR systems.

Dictionaries of words were built for the comparison to the attached word.

The present research uses multiple knowledge sources and basing on the Arabic language properties, statistical method, morpho-lexical analysis and dictionary look-up for error detection and correction.

Correction of errors in this research depends on the type of possible error, which can be: transposing two adjacent letters, rejection, replacing an incorrect letter, inserting a missing letter, substitution errors, which are most frequently committed by the OCR systems.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. 2010. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

الطالب، غيداء عبد العزيز....[و آخرون]. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 23، ع. 4 (2010)، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2010. مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674

نوع البيانات

مقالات

لغة النص

العربية

الملاحظات

يتضمن مراجع ببليوجرافية : ص. 140-141

رقم السجل

BIM-325674