![](/images/graphics-bg.png)
A scalable shallow learning approach for tagging Arabic news articles
المؤلفون المشاركون
al-Qadi, Lin
al-Rifai, Hudhayfah
Ubayd, Safa
al-Najjar, Ashraf Y.
المصدر
Jordanian Journal of Computetrs and Information Technology
العدد
المجلد 6، العدد 3 (30 سبتمبر/أيلول 2020)، ص ص. 263-280، 18ص.
الناشر
جامعة الأميرة سمية للتكنولوجيا
تاريخ النشر
2020-09-30
دولة النشر
الأردن
عدد الصفحات
18
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
Text classification is the process of automatically tagging a textual document with the most relevant set of labels.
the aim of this work is to automatically tag an input document based on its vocabulary features.
to achieve this goal, two large datasets have been constructed from various Arabic news portals.
the first dataset consists of 90k single-labeled articles from 4 domains (business, middle east, technology and sports).
the second dataset has over 290k multi-tagged articles.
the datasets shall be made freely available to the research community on Arabic computational linguistics.
to examine the usefulness of both datasets, we implemented an array of ten shallow learning classifiers.
in addition, we implemented an ensemble model to combine best classifiers together in a majority-voting classifier.
the performance of the classifiers on the first dataset ranged between 87.7% (ada-boost) and 97.9% (SVM).
analyzing some of the misclassified articles confirmed the need for a multi-label opposed to single-label categorization for better classification results.
we used classifiers that were compatible with multi-labeling tasks, such as logistic regression and xgboost.
we tested the multi-label classifiers on the second larger dataset.
a custom accuracy metric, designed for the multi-labeling task, has been developed for performance evaluation along with hamming loss metric.
xgboost proved to be the best multi-labeling classifier, scoring an accuracy of 91.3%, higher than the logistic regression score of 87.6%.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Qadi, Lin& al-Rifai, Hudhayfah& Ubayd, Safa& al-Najjar, Ashraf Y.. 2020. A scalable shallow learning approach for tagging Arabic news articles. Jordanian Journal of Computetrs and Information Technology،Vol. 6, no. 3, pp.263-280.
https://search.emarefa.net/detail/BIM-1415640
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
al-Rifai, Hudhayfah…[et al.]. A scalable shallow learning approach for tagging Arabic news articles. Jordanian Journal of Computetrs and Information Technology Vol. 6, no. 3 (Sep. 2020), pp.263-280.
https://search.emarefa.net/detail/BIM-1415640
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Qadi, Lin& al-Rifai, Hudhayfah& Ubayd, Safa& al-Najjar, Ashraf Y.. A scalable shallow learning approach for tagging Arabic news articles. Jordanian Journal of Computetrs and Information Technology. 2020. Vol. 6, no. 3, pp.263-280.
https://search.emarefa.net/detail/BIM-1415640
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 277-279
رقم السجل
BIM-1415640
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
![](/images/ebook-kashef.png)
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر
![](/images/kashef-image.png)