Accurate malware detection using LightGBM algorithm

Dissertant

al-Bustanji, Ahmad Muhammad Mustafa

Thesis advisor

al-Kasasibah, Muhammad Sharari Zamil

University

Mutah University

Faculty

Information Technology College

Department

Computer Science Department

University Country

Jordan

Degree

Master

Degree Date

2019

Arabic Abstract

تهدف هذه الدراسة الى تطوير نظام ذكي مضاد للبرمجيات الخبيثة قادر على اكتشافها و انهاءها فورا، و تركز هذه الدراسة على البرمجيات الخبيثة الخاصة بالأجهزة شبكة الانترنت ضمن ما يعرف باسم انترنت الأشياء، و ذلك من خلال استخدام احدى تقنيات الذكاء الصناعي، حيث تم تطبيق خوارزمية ذكاء صناعي حديثة التي ترتبط مع تسمى ( Light Gradient Boosting Algorithm ) LightGBM لتصنيف البرمجيات الخبيثة إلى عائلاتها و ذلك لضمان سهولة التعرف عليها في المستقبل بشكل مباشر من قبل البرمجيات المضادة للبرمجيات الخبيثة على مستوى الجهاز وعلى مستوى الشبكة.

استخدم المنهج المقترح في هذه الدراسة بيانات من أجهزة حقيقية تم استخدامها من أجهزة إنترنت الأشياء و قد قدمتها دراسة سابقة جمعتها لنفس الغرض، و تم تحليلها و تصنيفها باستخدام خوارزمية( Light ) ، و توضح طريقة التصنيف حلا فعالا و دقيقا ؛ فقد كانت نتائج الاختبارات دقيقة بنسبة %100 في التعرف على البرمجيات الخبيثة، و علاوة على ذلك، فقد أظهرت النتائج دون أدنى شك أن التقنية المقترحة فعالة في مرحلة مبكرة من الهجوم، مما يسهل إيقافه قبل الانتشار او احداث أي ضرر.

ان المنهج المقترح في هذه الرسالة قد حقق نتائج أفضل من النتائج التي حققتها العديد من الدراسات السابقة و التي استخدمت تقنيات مختلفة من تقنيات الذكاء الصناعي.

و على الرغم ان الدراسة التي استخدمت نفس البيانات كانت أفضل الدراسات السابقة من حيث النتائج إلا ان الدقة في نتائجها لم تصل الى الدقة التي وصلت اليه هذه الدراسة إضافة الى الخوارزمية الأبسط المستخدمة في هذه الدراسة.

English Abstract

In Zero-Day malware challenges, attackers take advantage of every second that the anti-malware vendor delays identifying the attacking malware signature and provide the updates.

Furthermore, the longer the detection phase delayed, the higher the damage to the host device.

Therefore, this study aims to develop an intelligent anti-malware system capable to instantly detect and terminate malware activities instead of waiting for anti-malware updates.

In its scope, the study focuses on the Internet of Things (IoT) malware detection based on Machine Learning (ML) techniques.

A recent open-source ML algorithm called Light Gradient Boosting Algorithm (Light GBM) is used in this study to develop instant anti-malware approach at both host and network layers without the need for any human intervention.

For evaluation purpose, the proposed approach adopts datasets obtained from real IoT devices using the Light GBM machine learning algorithm.

The results show a promising approach for detecting and classifying malware with high accuracy reaches (100%) at both the network and host levels based on cross-validation Holdout method.

Furthermore, this result is better than many previous related studies which used different Machine Learning and Deep Learning algorithms.

Though, the study which used the same dataset was the best among the literature.

However, it still slightly less than what this study achieved, besides the complexity which deep learning adds.

Finally, the results show the ability of the proposed approach to early detect IoT botnet attacks, which is an essential feature for terminating the botnet activity before propagating to any new network devices.

Main Subjects

Information Technology and Computer Science

No. of Pages

63

Table of Contents

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Theoretical background and literature review.

Chapter Three : IoT botnet detection using LightGBM algorithm.

Chapter Four : Results, and discussions.

References.

American Psychological Association (APA)

al-Bustanji, Ahmad Muhammad Mustafa. (2019). Accurate malware detection using LightGBM algorithm. (Master's theses Theses and Dissertations Master). Mutah University, Jordan
https://search.emarefa.net/detail/BIM-1402413

Modern Language Association (MLA)

al-Bustanji, Ahmad Muhammad Mustafa. Accurate malware detection using LightGBM algorithm. (Master's theses Theses and Dissertations Master). Mutah University. (2019).
https://search.emarefa.net/detail/BIM-1402413

American Medical Association (AMA)

al-Bustanji, Ahmad Muhammad Mustafa. (2019). Accurate malware detection using LightGBM algorithm. (Master's theses Theses and Dissertations Master). Mutah University, Jordan
https://search.emarefa.net/detail/BIM-1402413

Language

English

Data Type

Arab Theses

Record ID

BIM-1402413