Improved Feature-Selection Method Considering the Imbalance Problem in Text Categorization
المؤلفون المشاركون
Yang, Jieming
Qu, Zhaoyang
Liu, Zhiying
المصدر
العدد
المجلد 2014، العدد 2014 (31 ديسمبر/كانون الأول 2014)، ص ص. 1-17، 17ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2014-05-26
دولة النشر
مصر
عدد الصفحات
17
التخصصات الرئيسية
الطب البشري
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
The filtering feature-selection algorithm is a kind of important approach to dimensionality reduction in the field of the text categorization.
Most of filtering feature-selection algorithms evaluate the significance of a feature for category based on balanced dataset and do not consider the imbalance factor of dataset.
In this paper, a new scheme was proposed, which can weaken the adverse effect caused by the imbalance factor in the corpus.
We evaluated the improved versions of nine well-known feature-selection methods (Information Gain, Chi statistic, Document Frequency, Orthogonal Centroid Feature Selection, DIA association factor, Comprehensive Measurement Feature Selection, Deviation from Poisson Feature Selection, improved Gini index, and Mutual Information) using naïve Bayes and support vector machines on three benchmark document collections (20-Newsgroups, Reuters-21578, and WebKB).
The experimental results show that the improved scheme can significantly enhance the performance of the feature-selection methods.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Yang, Jieming& Qu, Zhaoyang& Liu, Zhiying. 2014. Improved Feature-Selection Method Considering the Imbalance Problem in Text Categorization. The Scientific World Journal،Vol. 2014, no. 2014, pp.1-17.
https://search.emarefa.net/detail/BIM-1050395
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Yang, Jieming…[et al.]. Improved Feature-Selection Method Considering the Imbalance Problem in Text Categorization. The Scientific World Journal No. 2014 (2014), pp.1-17.
https://search.emarefa.net/detail/BIM-1050395
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Yang, Jieming& Qu, Zhaoyang& Liu, Zhiying. Improved Feature-Selection Method Considering the Imbalance Problem in Text Categorization. The Scientific World Journal. 2014. Vol. 2014, no. 2014, pp.1-17.
https://search.emarefa.net/detail/BIM-1050395
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1050395
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر