An enhanced corpus for Arabic newspapers comments
المؤلفون المشاركون
Rehab, Hisham
Zaytuni, Abd al-Hafiz
Djoudi, Mahieddine
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 17، العدد 5 (30 سبتمبر/أيلول 2020)، ص ص. 789-798، 10ص.
الناشر
جامعة الزرقاء عمادة البحث العلمي
تاريخ النشر
2020-09-30
دولة النشر
الأردن
عدد الصفحات
10
التخصصات الرئيسية
الملخص EN
In this paper, we propose our enhanced approach to create a dedicated corpus for Algerian Arabic newspapers comments.
The developed approach has to enhance an existing approach by the enrichment of the available corpus and the inclusion of the annotation step by following the Model Annotate Train Test Evaluate Revise (MATTER) approach.
A corpus is created by collecting comments from web sites of three well know Algerian newspapers.
Three classifiers, support vector machines, naïve Bayes, and k-nearest neighbors, were used for classification of comments into positive and negative classes.
To identify the influence of the stemming in the obtained results, the classification was tested with and without stemming.
Obtained results show that stemming does not enhance considerably the classification due to the nature of Algerian comments tied to Algerian Arabic Dialect.
The promising results constitute a motivation for us to improve our approach especially in dealing with non-Arabic sentences, especially Dialectal and French ones.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Rehab, Hisham& Zaytuni, Abd al-Hafiz& Djoudi, Mahieddine. 2020. An enhanced corpus for Arabic newspapers comments. The International Arab Journal of Information Technology،Vol. 17, no. 5, pp.789-798.
https://search.emarefa.net/detail/BIM-1439768
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Rehab, Hisham…[et al.]. An enhanced corpus for Arabic newspapers comments. The International Arab Journal of Information Technology Vol. 17, no. 5 (Sep. 2020), pp.789-798.
https://search.emarefa.net/detail/BIM-1439768
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Rehab, Hisham& Zaytuni, Abd al-Hafiz& Djoudi, Mahieddine. An enhanced corpus for Arabic newspapers comments. The International Arab Journal of Information Technology. 2020. Vol. 17, no. 5, pp.789-798.
https://search.emarefa.net/detail/BIM-1439768
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 796-797
رقم السجل
BIM-1439768
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر