Improving the performance of Naïve Bayes algorithm for Arabic text categorization

العناوين الأخرى

تحسين أداء خوارزمية (Naïve Bayes)‎ في تصنيف النصوص العربية

مقدم أطروحة جامعية

Abu Aqulah, Nibras Jamal

مشرف أطروحة جامعية

Qaqish, Malik
al-Mashayikhi, Akram Uthman

أعضاء اللجنة

Azami, Muayyad Abd al-Razzaq
al-Mashaqibah, Firas Faris

الجامعة

جامعة عمان العربية

الكلية

كلية العلوم الحاسوبية و المعلوماتية

القسم الأكاديمي

قسم علم الحاسوب

دولة الجامعة

الأردن

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2010

الملخص الإنجليزي

In this research four techniques are implemented to find the best results using Naïve Bayes algorithm classifier for Arabic text categorization.

These techniques are:(Term Frequency (TF),Term Frequency –Inverse document frequency TF-IDF, Normalized TF-IDF, Normalized TF-IDF with N-Gram (N=2) statistical stemmer and threshold similarity 0.8). The four techniques are evaluated by two test sets.

The results showed that the Normalized TF-IDF with N-Gram with N=2 statistical stemmer with threshold similarity 0.8 technique had the best accuracy result, and the TF technique had the shortest running time

التخصصات الرئيسية

الرياضيات

الموضوعات

عدد الصفحات

45

قائمة المحتويات

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Classifier algorithms.

Chapter Three : Literature review.

Chapter Four : The proposed system architecture.

Chapter Five : Experiments and evaluation.

Chapter Six : Conclusion and future work.

References.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Abu Aqulah, Nibras Jamal. (2010). Improving the performance of Naïve Bayes algorithm for Arabic text categorization. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-529116

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Abu Aqulah, Nibras Jamal. Improving the performance of Naïve Bayes algorithm for Arabic text categorization. (Master's theses Theses and Dissertations Master). Amman Arab University. (2010).
https://search.emarefa.net/detail/BIM-529116

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Abu Aqulah, Nibras Jamal. (2010). Improving the performance of Naïve Bayes algorithm for Arabic text categorization. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-529116

لغة النص

الإنجليزية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-529116