Image SPAM detection using hybrid techniques

Other Title(s)

كشف الرسائل الاقتحامية (SPAM)‎ باستخدام الأساليب الهجينة

Dissertant

Abu Zayd, Nawal Nayil Mamduh

Thesis advisor

al-Halasah, Raniya Azmi Ibrahim

University

Mutah University

Faculty

Information Technology College

Department

Computer Science Department

University Country

Jordan

Degree

Master

Degree Date

2021

Arabic Abstract

في الآونة الأخيرة، أصبح البريد الإلكتروني مستهدفا من قبل مرسلي الرسائل العشوائية، حيث إنه أحد أكثر الأماكن شيوعا لإرسال الرسائل يرسل مرسلو البريد الإلكتروني العشوائي رسائل غير مرغوب فيها (بريد عشوائي) إلى عدد من المستخدمين بهدف نشر الفيروسات و التدمير و الحصول على معلومات المستخدمين.

الصور غير المرغوب فيها هي أحد أنواع البريد العشوائي، حيث يقوم مرسلو البريد العشوائي بمعالجة الصور و تغيير خصائص الصورة، خاصة ألوان الخلفية أو نوع الخط أو إضافة عناصر إلى الصور لنشر البريد العشوائي.

هناك العديد من الأساليب التي يتم تطبيقها لاكتشاف الصور العشوائية و لتحديد ما إذا كانت الصورة بريد عشوائي في أطروحتنا، قمنا ببناء نظام يعتمد على خطوتين أساسيتين، خطوة استخراج الميزة و خطوة تصنيف الصورة.

في خطوة استخراج الميزة، استخدمنا الرسم البياني للون و اتجاه التدرج.

بالنسبة للتصنيف، استخدمنا الشبكة العصبية التلافيفية بالإضافة إلى عدد من خوارزميات تصنيف الماكينة الشائعة الاستخدام في هذا المجال.

لقد أجرينا عدة تجارب لتقييم كفاءة أداء خوارزميات التعلم الآلي لاكتشاف البريد العشوائي، نحن نستخدم مجموعة بيانات Image Spam Hunter، و تتكون مجموعة البيانات هذه من 928 صورة غير مرغوب فيها يتم استخراجها من رسائل البريد الإلكتروني العشوائية الحقيقية كمجموعة عينات من البريد العشوائي.

تم اختبار خوارزميات التعلم الآلي للكشف عن الصور غير المرغوب فيها و التي هي (C4.5 (DT و SVM) و (KNN) و (NB) و والشبكة العصبية التلافيفية (CNN).

English Abstract

Recently, email has become targeted by senders of spam messages, as it is one of the most common places to send messages, spammers send undesired messages (spam) to several users to spread viruses, destruction and obtaining user's information.

Spam images are one of the spam types, spammer process images and change the characteristics of the image, especially background colors, font type, or adding artifacts to the images to spread spam.

Many techniques are applied to detect spam images and to determine whether the image is spam in our thesis, we constructed a system based on two basic steps, the feature extraction step, and the image classification step.

in the feature extraction step, we used the feature extraction from vgg16 detection and classification extraction based on image net weights.

For the classification, we used the convolutional neural network in addition to several machine classification algorithms commonly used in this field.

We conducted several experiments to evaluate the efficiency the performance of machine learning algorithms for spam detection.

This thesis uses the Image Spam Hunter dataset, this dataset spam images which are extracted from real spam emails as the spam sample set Machine learning algorithms were tested to detect spam images which: C4.5 Decision Tree (DT), Support Vector Machine (SVM), K- Nearest Neighbor (KNN), Naïve Bays (NB), Random Forest (RF), and Convolutional Neural Network (CNN).

Main Subjects

Information Technology and Computer Science

Topics

No. of Pages

60

Table of Contents

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Literature review.

Chapter Three : Design and methodology.

Chapter Four : Evaluation and experiment results.

References.

American Psychological Association (APA)

Abu Zayd, Nawal Nayil Mamduh. (2021). Image SPAM detection using hybrid techniques. (Master's theses Theses and Dissertations Master). Mutah University, Jordan
https://search.emarefa.net/detail/BIM-1343486

Modern Language Association (MLA)

Abu Zayd, Nawal Nayil Mamduh. Image SPAM detection using hybrid techniques. (Master's theses Theses and Dissertations Master). Mutah University. (2021).
https://search.emarefa.net/detail/BIM-1343486

American Medical Association (AMA)

Abu Zayd, Nawal Nayil Mamduh. (2021). Image SPAM detection using hybrid techniques. (Master's theses Theses and Dissertations Master). Mutah University, Jordan
https://search.emarefa.net/detail/BIM-1343486

Language

English

Data Type

Arab Theses

Record ID

BIM-1343486