An anti-spam filter based on one-class IB method in small training sets
المؤلفون المشاركون
Yang, Chen
Zhao, Shaofeng
Ma, Junxia
Zhang, Dan
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 13، العدد 6 (31 ديسمبر/كانون الأول 2016)8ص.
الناشر
تاريخ النشر
2016-12-31
دولة النشر
الأردن
عدد الصفحات
8
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الموضوعات
الملخص EN
We present an approach to email filtering based on one-class Information Bottleneck (IB) method in small training sets.
When themes of emails are changing continually, the available training set which is high-relevant to the current theme will be small.
Hence, we further show how to estimate the learning algorithm and how to filter the spam in the small training sets.
First, In order to preserve classification accuracy and avoid over-fitting while substantially reducing training set size, we consider the learning framework as the solution of one-class centroid only averaged by highly positive emails, and second, we design a simple binary classification model to filters spam by the comparison of similarity between emails and centroids.
Experimental results show that in small training sets our method can significantly improve classification accuracy compared with the currently popular methods, such as: Naive Bayes, AdaBoost and SVM.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Zhao, Shaofeng& Zhang, Dan& Ma, Junxia& Yang, Chen. 2016. An anti-spam filter based on one-class IB method in small training sets. The International Arab Journal of Information Technology،Vol. 13, no. 6.
https://search.emarefa.net/detail/BIM-654851
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Yang, Chen…[et al.]. An anti-spam filter based on one-class IB method in small training sets. The International Arab Journal of Information Technology Vol. 13, no. 6 (Dec. 2016).
https://search.emarefa.net/detail/BIM-654851
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Zhao, Shaofeng& Zhang, Dan& Ma, Junxia& Yang, Chen. An anti-spam filter based on one-class IB method in small training sets. The International Arab Journal of Information Technology. 2016. Vol. 13, no. 6.
https://search.emarefa.net/detail/BIM-654851
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes appendix.
رقم السجل
BIM-654851
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر