Using wordnet for text categorization
المؤلفون المشاركون
Rahmun, Abd al-Latif
al-Berrichi, Zakariyya
Bentaalah, Muhammad Amin
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 5، العدد 1 (31 يناير/كانون الثاني 2008)، ص ص. 17-24، 8ص.
الناشر
تاريخ النشر
2008-01-31
دولة النشر
الأردن
عدد الصفحات
8
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
This paper explores a method that use Word Net concept to categorize text documents.
The bag of words representation used for text representation is unsatisfactory as it ignores possible relations between terms.
The proposed method extracts generic concepts from Word Net for all the terms in the text then combines them with the terms in different ways to form a new representative vector.
The effects of this method are examined in several experiments using the multivariate chi-square to reduce the dimensionality, the cosine distance and two benchmark corpus the reuters-21578 newswire articles and the 20 newsgroups data for evaluation.
The proposed method is especially effective in raising the macro-averaged F1 value, which increased to 0.714 for the Reuters from 0.649 and to 0.719 for the 20 newsgroups from 0.667.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Berrichi, Zakariyya& Rahmun, Abd al-Latif& Bentaalah, Muhammad Amin. 2008. Using wordnet for text categorization. The International Arab Journal of Information Technology،Vol. 5, no. 1, pp.17-24.
https://search.emarefa.net/detail/BIM-10554
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Bentaalah, Muhammad Amin…[et al.]. Using wordnet for text categorization. The International Arab Journal of Information Technology Vol. 5, no. 1 (Jan. 2008), pp.17-24.
https://search.emarefa.net/detail/BIM-10554
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Berrichi, Zakariyya& Rahmun, Abd al-Latif& Bentaalah, Muhammad Amin. Using wordnet for text categorization. The International Arab Journal of Information Technology. 2008. Vol. 5, no. 1, pp.17-24.
https://search.emarefa.net/detail/BIM-10554
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 23
رقم السجل
BIM-10554
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر