التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي
Joint Authors
الطالب، غيداء عبد العزيز
النعمة، ماهر أحمد أنور
الطائي، رافدة حميد
Source
التربية و العلم : مجلة علمية للبحوث العلمية الأساسية
Issue
Vol. 23, Issue 4 (31 Dec. 2010), pp.130-141, 12 p.
Publisher
University of Mosul College of Education for Pure Science
Publication Date
2010-12-31
Country of Publication
Iraq
No. of Pages
12
Main Subjects
Languages & Comparative Literature
Topics
Abstract AR
يقترح هذا البحث طريقة إحصائية و تحليل مورفولوجي لتصحيح الكلمات العربية الخاطئة بوصفها وسيلة معالجة نهائية للكلمات العربية الناتجة من أنظمة التمييز الضوئي OCR.
يلحق بالبحث قواميس بالكلمات بهدف مقارنة الكلمة تحت المعالجة مع مطابقتها في القاموس.
يستخدم هذا البحث عدد من مصادر المعرفة ويعتمد خصائص اللغة العربية، طريقة إحصائية، تحليل مورفولوجي، فضلا عن البحث في القواميس لتحديد موقع الخطأ و تصحيحه.
تتوقف عملية تصحيح الأخطاء على نوع الخطأ المحتمل، و الذي يشمل القلب المكاني، و إبدال الحروف، و حذفها، و إضافتها الممكنة، و ذلك باستبدال الحروف المنقلبة بتلك التي تشابهها، و تعويض الحروف المحذوفة بتلك المسموح بها داخل سياق الكلمة، و هي الأخطاء الأكثر حدوثا في أنظمة التمييز الضوئي.
Abstract EN
In this research we propose a statistical method and morpho-lexical analysis for correcting Arabic words as a post processor for Arabic words output from OCR systems.
Dictionaries of words were built for the comparison to the attached word.
The present research uses multiple knowledge sources and basing on the Arabic language properties, statistical method, morpho-lexical analysis and dictionary look-up for error detection and correction.
Correction of errors in this research depends on the type of possible error, which can be: transposing two adjacent letters, rejection, replacing an incorrect letter, inserting a missing letter, substitution errors, which are most frequently committed by the OCR systems.
American Psychological Association (APA)
الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. 2010. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674
Modern Language Association (MLA)
الطالب، غيداء عبد العزيز....[و آخرون]. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 23، ع. 4 (2010)، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674
American Medical Association (AMA)
الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2010. مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674
Data Type
Journal Articles
Language
Arabic
Notes
يتضمن مراجع ببليوجرافية : ص. 140-141
Record ID
BIM-325674