Toward an Arabic essay grading benchmark for machine learning
العناوين الأخرى
بناء معيار لتصحيح الأسئلة المقالية في اللغة العربية لتعلم الآلة
مقدم أطروحة جامعية
al-Ziyadat, Rawan Abd al-Halim
مشرف أطروحة جامعية
الجامعة
جامعة الشرق الأوسط
الكلية
كلية تكنولوجيا المعلومات
القسم الأكاديمي
قسم علم الحاسوب
دولة الجامعة
الأردن
الدرجة العلمية
ماجستير
تاريخ الدرجة العلمية
2020
الملخص العربي
بعد التصحيح التلقائي للأسئلة المقالية أداة، حيوية، لأنه يوفر الكثير من المزايا مثل الحصول على العلامة دون تحيز بشري و جهد سريع و آمن في الوقت الحاضر، أصبحت غالبية أنظمة التصحيح التلقائي للاسئلة تعتمد على الذكاء الاصطناعي مثل التعلم الآلي.
و نتيجة لذلك، معظم أنظمة التصحيح التلقائي تعتمد حاليا على التعلم الآلي للتصحيح التلقائي للأسئلة المقالية، حيث يتم تصحيح الاسئلة اعتمادا على مجموعة من الاجابات النموذجية معدة مسبقا لاستخدامها في التدريب و التحقق من صحتها.
بالنسبة لمقالات اللغة الإنجليزية، توجد مجموعة بيانات ASAP لتصنيف المقالات باستخدام التعلم الألي و لكن لا توجد مجموعات بيانات للتصحيح التلقائي للأسئلة المقالية لتعلم الآلة.
لذلك، هذه الرسالة هي محاولة لجمع وإنشاء مجموعة بيانات لتصحيح الأسئلة المقالية لتعلم الآلة.
تحتوي هذه الرسالة على مجموعة البيانات المعتمدة على الاسئلة المقالية مع إجابات نموذجية متدرجة لمواضيع مختلفة و لمستويات مختلفة.
تم اختبار وتقييم مجموعة البيانات التي تم جمعها باستخدام خوارزميات التصنيف الأكثر شهرة لتصحيح الاسئلة المقالية تلقائيا باللغة العربية مثل decision tree Native Bayes، .(classifier) تظهر النتيجة التجريبية أن مجموعة البيانات مناسبة لخوارزميات التعلم الآلي، حيث تظهر نتائج دقة الخوارزميات على مجموعة البيانات كالتالي 79% و81 و 86% meta.
الملخص الإنجليزي
Using Automatic Essay Grading (AEG) is seen as a vital tool, as it provides a lot of advantages like getting the marks without human bias, quick and safe effort.
Nowadays, the majority of grading systems have become dependent on artificial intelligence such as machine learning.
As a result, most of AEG systems utilized machine learning to grade essays based on prepared dataset for training and validation.
For the English essays there is an Automated Student Assessment Prize (ASAP) dataset for grading essays using machine learning but there are no Arabic essays grading datasets for machine learning.
Therefore, this thesis is an attempt to collect and establish a dataset for Arabic essay grading for machine learning.
In this thesis, the established dataset or benchmark contains essay questions with their graded model answers for a various topic across most all different school levels.
The collected dataset was tested and evaluated using the best-known classification algorithms such as Naive Bayes, decision tree, and meta classifier.
The experimental result shows that dataset is suitable for the machine learning algorithms, where the classifiers performance results shows a 79%, 81%, 86% as accuracy based on established dataset.
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
اللغة العربية وآدابها
الموضوعات
عدد الصفحات
58
قائمة المحتويات
Table of contents.
Abstract.
Abstract in Arabic.
Chapter One : Introduction.
Chapter Two : Background and literature review.
Chapter Three : Methodology and the proposed model.
Chapter Four : Implementation and evaluation results.
Chapter Five : Conclusion and future work.
References.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Ziyadat, Rawan Abd al-Halim. (2020). Toward an Arabic essay grading benchmark for machine learning. (Master's theses Theses and Dissertations Master). Middle East University, Jordan
https://search.emarefa.net/detail/BIM-970877
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
al-Ziyadat, Rawan Abd al-Halim. Toward an Arabic essay grading benchmark for machine learning. (Master's theses Theses and Dissertations Master). Middle East University. (2020).
https://search.emarefa.net/detail/BIM-970877
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Ziyadat, Rawan Abd al-Halim. (2020). Toward an Arabic essay grading benchmark for machine learning. (Master's theses Theses and Dissertations Master). Middle East University, Jordan
https://search.emarefa.net/detail/BIM-970877
لغة النص
الإنجليزية
نوع البيانات
رسائل جامعية
رقم السجل
BIM-970877
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر