An ontology driven data mining approach for CVD diagnosing among diabetic patients in Gaza Strip

Other Title(s)

منهجية مستمدة من أنطولوجيا التنقيب عن البيانات لتشخيص أمراض القلب عند مرضى السكر في قطاع غزة

Dissertant

al-Qrinawi, Muhammad Ibrahim Faraj

Thesis advisor

al-Siraj, Wail Fikri

University

Islamic University

Faculty

Faculty of Information Technology

Department

Information Technology

University Country

Palestine (Gaza Strip)

Degree

Master

Degree Date

2018

Arabic Abstract

البيئة الصحية غنية بشكل كبير بالبيانات التي بحاجة إلى استخراج المعرفة التي تعد ضرورية لإنقاذ حياة الناس.

اكتشاف المعرفة الطبية هو عملية لاستخراج أنماط المعرفة Knowledge patterns من البيانات الطبية الحيوية.

يستخدم التعلم الآلي و الاحصاء و التصور لاكتشاف وتقديم المعرفة بشكل يسهل فهمه.

اكتشاف المعرفة الطبية مفيد و حيوي لاتخاذ قرارات فعالة و خاصة في تطوير استراتيجيات و سياسات العلاجات الطبية الوقائية.

تعتبر أساليب التنقيب عن البيانات من أفضل الطرق المعروفة للتعرف على معايير البيانات المخفية.

تستخدم هندسة علم الوجود Ontology Engineering في عملية تحسين تمثيل مجال المعرفة و في تحسين تقنيات التنقيب على أساس الأنماط المكتشفة.

في هذه الرسالة، قام الباحث بتطبيق تقنيات قائمة على الأنطولوجيا Ontology على قاعدة بيانات تتعلق بمرضى السكري يعانون من الأمراض القلبية الوعائية.

تتكون قاعدة البيانات من 300 مريض من قطاع غزة في العام 2015-2016، و ذلك لتحديد العلاقة بين النوع الثاني من داء السكري و الأمراض القلبية الوعائية من خلال التحاليل المختبرية الهامة التي يحددها الأطباء.

تم استخدام تقنيات تنقيب البيانات مثل قواعد الحث Induction، و قواعد الارتباط Association و طريقة شجرة القرار Decision Tree في هذا البحث بدعم من علم الوجود من أجل مقارنة النتائج مع نتائج اكتشاف نمط التكرار وطريقة الحث باستخدام قواعد استخراج البيانات الخوارزمية و الأنطولوجية ( RMonto ).

تعكس نتائج هذه الدراسة أن استخدام الأنطولوجيات يقلل من عدد السمات في مرحلة ما قبل المعالجة و يساعد في جميع مراحل استخراج البيانات ؛ بالإضافة إلى دورها الهام في تنقيب البيانات الأنطولوجية.

تظهر نتائج أساليب التنقيب عن البيانات و تنقيب البيانات في علم الوجود أهمية بعض الاختبارات المعملية مثل LP (a) و CRP و HDL و FBG و TG و LDH و Chol للتنبؤ بالمخاطر الامراض القلبية الوعائية بين مرضى T2DM بنسبة تعلم عالية الدقة تقدر بـ 91% .

English Abstract

Healthcare environment is rich of data, but still needs knowledge extraction that is necessarily important for saving people lives.

Medical Knowledge discovery is a process of extracting knowledge patterns from biomedical data.

It uses machine learning, statistical techniques and visualization to discover and present knowledge in a form that is easily comprehensible.

Medical Knowledge discovery is useful and crucial for making effective decisions especially in developing strategies and policies of preventive medical treatments.

Data mining methods are the best-known way to recognize the hidden data standards.

Ontology engineering used to improve knowledge domain representation.

Ontology has been used to improve a specialized knowledge domains representation to get more efficiency in data mining results.

In this thesis, we apply ontology driven data mining techniques on a dataset of 300- diabetes patients form Gaza Strip in the year 2015-2016.

These patients have cardiovascular disease.

This process performed to identify the relationship between diabetes patients and their important laboratory tests specified by doctors.

Doctors aim to investigate the probability of cardiovascular disease occurrence and stroke happening.

Rule induction, association rules and decision tree methods were used in support of ontology.

In a late phase, we used frequent pattern discovery and rules induction method using ontological data mining algorithm (RMonto).

The findings of this study reveals that the use of ontologies minimizes the number of attributes in the pre-processing stage and helps in all data mining stages; in addition to its important role in ontological data mining method.

The results of data mining methods and ontological data mining shows that the impact of some laboratory tests like: LP(a),CRP,HDL,FBG,TG,LDH and Chol to predict CVD risk among T2DM patients with learning accuracy ratio about 91%.

Main Subjects

Information Technology and Computer Science

Topics

No. of Pages

85

Table of Contents

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Literature review.

Chapter Three : Research proposal and methodology.

Chapter Four : Cardiovascular diseases ontology implementation.

Chapter Five : Experiments results.

Chapter Six : Evaluation and recommendations.

Chapter Seven : Conclusion and future work.

References.

American Psychological Association (APA)

al-Qrinawi, Muhammad Ibrahim Faraj. (2018). An ontology driven data mining approach for CVD diagnosing among diabetic patients in Gaza Strip. (Master's theses Theses and Dissertations Master). Islamic University, Palestine (Gaza Strip)
https://search.emarefa.net/detail/BIM-905707

Modern Language Association (MLA)

al-Qrinawi, Muhammad Ibrahim Faraj. An ontology driven data mining approach for CVD diagnosing among diabetic patients in Gaza Strip. (Master's theses Theses and Dissertations Master). Islamic University. (2018).
https://search.emarefa.net/detail/BIM-905707

American Medical Association (AMA)

al-Qrinawi, Muhammad Ibrahim Faraj. (2018). An ontology driven data mining approach for CVD diagnosing among diabetic patients in Gaza Strip. (Master's theses Theses and Dissertations Master). Islamic University, Palestine (Gaza Strip)
https://search.emarefa.net/detail/BIM-905707

Language

English

Data Type

Arab Theses

Record ID

BIM-905707