التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي
المؤلفون المشاركون
الطالب، غيداء عبد العزيز
النعمة، ماهر أحمد أنور
الطائي، رافدة حميد
المصدر
التربية و العلم : مجلة علمية للبحوث العلمية الأساسية
العدد
المجلد 23، العدد 4 (31 ديسمبر/كانون الأول 2010)، ص ص. 130-141، 12ص.
الناشر
جامعة الموصل كلية التربية للعلوم الصرفة
تاريخ النشر
2010-12-31
دولة النشر
العراق
عدد الصفحات
12
التخصصات الرئيسية
الموضوعات
الملخص AR
يقترح هذا البحث طريقة إحصائية و تحليل مورفولوجي لتصحيح الكلمات العربية الخاطئة بوصفها وسيلة معالجة نهائية للكلمات العربية الناتجة من أنظمة التمييز الضوئي OCR.
يلحق بالبحث قواميس بالكلمات بهدف مقارنة الكلمة تحت المعالجة مع مطابقتها في القاموس.
يستخدم هذا البحث عدد من مصادر المعرفة ويعتمد خصائص اللغة العربية، طريقة إحصائية، تحليل مورفولوجي، فضلا عن البحث في القواميس لتحديد موقع الخطأ و تصحيحه.
تتوقف عملية تصحيح الأخطاء على نوع الخطأ المحتمل، و الذي يشمل القلب المكاني، و إبدال الحروف، و حذفها، و إضافتها الممكنة، و ذلك باستبدال الحروف المنقلبة بتلك التي تشابهها، و تعويض الحروف المحذوفة بتلك المسموح بها داخل سياق الكلمة، و هي الأخطاء الأكثر حدوثا في أنظمة التمييز الضوئي.
الملخص EN
In this research we propose a statistical method and morpho-lexical analysis for correcting Arabic words as a post processor for Arabic words output from OCR systems.
Dictionaries of words were built for the comparison to the attached word.
The present research uses multiple knowledge sources and basing on the Arabic language properties, statistical method, morpho-lexical analysis and dictionary look-up for error detection and correction.
Correction of errors in this research depends on the type of possible error, which can be: transposing two adjacent letters, rejection, replacing an incorrect letter, inserting a missing letter, substitution errors, which are most frequently committed by the OCR systems.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. 2010. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
الطالب، غيداء عبد العزيز....[و آخرون]. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 23، ع. 4 (2010)، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
الطالب، غيداء عبد العزيز والنعمة، ماهر أحمد أنور والطائي، رافدة حميد. التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2010. مج. 23، ع. 4، ص ص. 130-141.
https://search.emarefa.net/detail/BIM-325674
نوع البيانات
مقالات
لغة النص
العربية
الملاحظات
يتضمن مراجع ببليوجرافية : ص. 140-141
رقم السجل
BIM-325674
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر