Image SPAM detection using hybrid techniques
Other Title(s)
كشف الرسائل الاقتحامية (SPAM) باستخدام الأساليب الهجينة
Dissertant
Thesis advisor
al-Halasah, Raniya Azmi Ibrahim
University
Mutah University
Faculty
Information Technology College
Department
Computer Science Department
University Country
Jordan
Degree
Master
Degree Date
2021
Arabic Abstract
في الآونة الأخيرة، أصبح البريد الإلكتروني مستهدفا من قبل مرسلي الرسائل العشوائية، حيث إنه أحد أكثر الأماكن شيوعا لإرسال الرسائل يرسل مرسلو البريد الإلكتروني العشوائي رسائل غير مرغوب فيها (بريد عشوائي) إلى عدد من المستخدمين بهدف نشر الفيروسات و التدمير و الحصول على معلومات المستخدمين.
الصور غير المرغوب فيها هي أحد أنواع البريد العشوائي، حيث يقوم مرسلو البريد العشوائي بمعالجة الصور و تغيير خصائص الصورة، خاصة ألوان الخلفية أو نوع الخط أو إضافة عناصر إلى الصور لنشر البريد العشوائي.
هناك العديد من الأساليب التي يتم تطبيقها لاكتشاف الصور العشوائية و لتحديد ما إذا كانت الصورة بريد عشوائي في أطروحتنا، قمنا ببناء نظام يعتمد على خطوتين أساسيتين، خطوة استخراج الميزة و خطوة تصنيف الصورة.
في خطوة استخراج الميزة، استخدمنا الرسم البياني للون و اتجاه التدرج.
بالنسبة للتصنيف، استخدمنا الشبكة العصبية التلافيفية بالإضافة إلى عدد من خوارزميات تصنيف الماكينة الشائعة الاستخدام في هذا المجال.
لقد أجرينا عدة تجارب لتقييم كفاءة أداء خوارزميات التعلم الآلي لاكتشاف البريد العشوائي، نحن نستخدم مجموعة بيانات Image Spam Hunter، و تتكون مجموعة البيانات هذه من 928 صورة غير مرغوب فيها يتم استخراجها من رسائل البريد الإلكتروني العشوائية الحقيقية كمجموعة عينات من البريد العشوائي.
تم اختبار خوارزميات التعلم الآلي للكشف عن الصور غير المرغوب فيها و التي هي (C4.5 (DT و SVM) و (KNN) و (NB) و والشبكة العصبية التلافيفية (CNN).
English Abstract
Recently, email has become targeted by senders of spam messages, as it is one of the most common places to send messages, spammers send undesired messages (spam) to several users to spread viruses, destruction and obtaining user's information.
Spam images are one of the spam types, spammer process images and change the characteristics of the image, especially background colors, font type, or adding artifacts to the images to spread spam.
Many techniques are applied to detect spam images and to determine whether the image is spam in our thesis, we constructed a system based on two basic steps, the feature extraction step, and the image classification step.
in the feature extraction step, we used the feature extraction from vgg16 detection and classification extraction based on image net weights.
For the classification, we used the convolutional neural network in addition to several machine classification algorithms commonly used in this field.
We conducted several experiments to evaluate the efficiency the performance of machine learning algorithms for spam detection.
This thesis uses the Image Spam Hunter dataset, this dataset spam images which are extracted from real spam emails as the spam sample set Machine learning algorithms were tested to detect spam images which: C4.5 Decision Tree (DT), Support Vector Machine (SVM), K- Nearest Neighbor (KNN), Naïve Bays (NB), Random Forest (RF), and Convolutional Neural Network (CNN).
Main Subjects
Information Technology and Computer Science
Topics
No. of Pages
60
Table of Contents
Table of contents.
Abstract.
Abstract in Arabic.
Chapter One : Introduction.
Chapter Two : Literature review.
Chapter Three : Design and methodology.
Chapter Four : Evaluation and experiment results.
References.
American Psychological Association (APA)
Abu Zayd, Nawal Nayil Mamduh. (2021). Image SPAM detection using hybrid techniques. (Master's theses Theses and Dissertations Master). Mutah University, Jordan
https://search.emarefa.net/detail/BIM-1343486
Modern Language Association (MLA)
Abu Zayd, Nawal Nayil Mamduh. Image SPAM detection using hybrid techniques. (Master's theses Theses and Dissertations Master). Mutah University. (2021).
https://search.emarefa.net/detail/BIM-1343486
American Medical Association (AMA)
Abu Zayd, Nawal Nayil Mamduh. (2021). Image SPAM detection using hybrid techniques. (Master's theses Theses and Dissertations Master). Mutah University, Jordan
https://search.emarefa.net/detail/BIM-1343486
Language
English
Data Type
Arab Theses
Record ID
BIM-1343486