Arabic text categorization : a comparative study of different representation modes
المؤلفون المشاركون
al-Berrichi, Zakariyya
Ubaydi, Karimah
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 9، العدد 5 (30 سبتمبر/أيلول 2012)6ص.
الناشر
تاريخ النشر
2012-09-30
دولة النشر
الأردن
عدد الصفحات
6
التخصصات الرئيسية
الموضوعات
الملخص EN
The quantity of accessible information on Internet is phenomenal, and its categorization remains one of the most important problems.
A lot of work is currently, focused on English rightly since ; it is the dominant language of the Web.
However, a need arises for the other languages, because the Web is each day more multilingual.
The need is much more pressing for the Arabic language.
Our research is on the categorization of the Arabic texts, its originality relates to the use of a conceptual representation of the text.
For that we will use Arabic Word Net (AWN) as a lexical and semantic resource.
To comprehend its effect, we incorporate it in a comparative study with the other usual modes of representation (bag of words and N-grams), and we use the K-NN learning scheme with different similarity measures.
The results show the benefits and advantages of this representation compared to the more conventional methods, and demonstrate that the addition of the semantic dimension is one of the most promising ways for the automatic categorization of Arabic texts.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Berrichi, Zakariyya& Ubaydi, Karimah. 2012. Arabic text categorization : a comparative study of different representation modes. The International Arab Journal of Information Technology،Vol. 9, no. 5.
https://search.emarefa.net/detail/BIM-305113
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
al-Berrichi, Zakariyya& Ubaydi, Karimah. Arabic text categorization : a comparative study of different representation modes. The International Arab Journal of Information Technology Vol. 9, no. 5 (Sep. 2012).
https://search.emarefa.net/detail/BIM-305113
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Berrichi, Zakariyya& Ubaydi, Karimah. Arabic text categorization : a comparative study of different representation modes. The International Arab Journal of Information Technology. 2012. Vol. 9, no. 5.
https://search.emarefa.net/detail/BIM-305113
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references.
رقم السجل
BIM-305113
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر