Comparing several machine learning algorithms in predicting breast cancer

Other Title(s)

المقارنة بين الأدوات المختلفة لتعلم الألة للتنبؤ بسرطان الثدي


Fashafishah, Ashraf Hasan Ahmad

Thesis advisor

Abu Hasan, Hasan


Birzeit University


Faculty of Engineering and Technology


Department of Computer Systems Engineering

University Country

Palestine (West Bank)



Degree Date


Arabic Abstract

يعتبر سرطان الثدي أكثر شيوعا بين الإناث في فلسطين مقارنة مع أنواع السرطان الأخرى حيث تتزايد أعداد الإصابات في هذا المرض بشكل ملحوظ حسب تقارير وزارة الصحة الفلسطينية فان نسبة الإصابة بمرض سرطان الثدي ارتفعت من 13.2 حالة لكل 100000أنثى في عام 2016 الى 40 حالة لكل 100000أنثى في عام 2019, ويعزو هذا الارتفاع الى عدم تشخيص المرضى في المراحل المبكرة .

وهدف هذا البحث لتحديد الخوارزمية الأكثر دقة من بين الخوارزميات المستخدمة في البحث (SVM, DT, NB, and ANN), كذلك الأمر تحديد العوامل الأكثر ارتباطا بالمرض حسب بيانات وزارة الصحة الفلسطينية.

وذلك من اجل الحد من الارتفاع نسب الإصابة بالمرض.

والدراسة هي عبارة عن جمع بيانات ثانوية من مديريات وزارة الصحة الفلسطينية في الضفة الغربية, حيث تم جمع 1140 حالة تم تشخيصه في الفترة الواقعة من شهر نيسان 2019 الى شهر تشرين أول من عام 2020.

تم تحليل البيانات بواسطة الحزمة البرمجية ويكا وكذلك الأمر تم استخدام برنامج R.

وقد تم عمل الجداول والرسومات الضروية للتحليل حيث تم تحديد الخوارزمية SVM كافضل خوارزمية من الخوارزميات المستخدمة في البحث وكانت العوامل الأكثر ارتباطا بالمرض هي : شكل وحجم الكتلة وتناول الكحول واستخدام الهرمونات و السجل العائلي ومكان السكن.

English Abstract

Breast cancer is more common among females in Palestine compared to other types of cancer, as the number of women diagnosed by this disease increases significantly from 2016 to 2019) according to the reports of the Palestinian Ministry of Health, the incidence of breast cancer increased from 13.2 cases per 100,000 females in 2016 to 40 cases per 100,000 females people in 2019, they attribute this increase to the patients not being diagnosed in the early stages.

This research aims to determine the most accurate algorithm among the algorithms used in the search (SVM, DT, NB, and ANN), as well as to determine the factors most associated with the disease according to the data of the Palestinian Ministry of Health.

The study is a collection of secondary data from the directorates of the Palestinian Ministry of Health in the West Bank, where 1140 cases were diagnosed in the period from April 2019 to October 2020.

The data were analyzed using the WEKA software package, as well as the R program.

And tables and drawings were used for analysis, where the SVM algorithm was identified as the best algorithm of the algorithms used in the research.

Also, the factors most associated with the disease were: the shape and size of the mass, Alcohol consumption, hormonal therapy, the family record, and place of residence (Region).

Main Subjects

Information Technology and Computer Science

No. of Pages


Table of Contents

Table of contents.


Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Literature review.

Chapter Three : Methodology.

Chapter Four : Results and discussion.

Chapter Five : Conclusion and recommendations.


American Psychological Association (APA)

Fashafishah, Ashraf Hasan Ahmad. (2021). Comparing several machine learning algorithms in predicting breast cancer. (Master's theses Theses and Dissertations Master). Birzeit University, Palestine (West Bank)

Modern Language Association (MLA)

Fashafishah, Ashraf Hasan Ahmad. Comparing several machine learning algorithms in predicting breast cancer. (Master's theses Theses and Dissertations Master). Birzeit University. (2021).

American Medical Association (AMA)

Fashafishah, Ashraf Hasan Ahmad. (2021). Comparing several machine learning algorithms in predicting breast cancer. (Master's theses Theses and Dissertations Master). Birzeit University, Palestine (West Bank)



Data Type

Arab Theses

Record ID
