Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques

Other Title(s)

دراسة أثر معالجة القيم المحذوفة في قاعدة البيانات على كفاءة تقنيات تنقيب البيانات

Joint Authors

Hasan, Bushra Muhammad
al-Suhal, Ghayda Abd al-Razzaq

Source

Basrah Journal of Science

Issue

Vol. 30, Issue 2A (30 Sep. 2012), pp.128-141, 14 p.

Publisher

University of Basrah College of Science

Publication Date

2012-09-30

Country of Publication

Iraq

No. of Pages

14

Main Subjects

Mathematics

Topics

Abstract AR

البيانات الطبية تمتلك معلومات كامنة لاستخلاص أنماط مخبأة في قواعد البيانات. التصنيف هو شكل من تحليل البيانات لاستخلاص أنماط لوصف أصناف البيانات المهمة أو لتخمين اتجاه البيانات المستقبلي بعض التحليلات تساعد بتزويدنا بفهم جيد للبيانات الكبيرة التشخيص الطبي من الأعراض، هو أحد الأمثلة من مهمات التصنيف التي تكون فيها الأصناف الناتجة آما حالات المرض المختلفة أو الحالة الممكنة. تنظيف البيانات و تسويتها يحسن الدقة و الكفاءة في خوارزميات التنقيب. في هذا البحث تم استخدام تقنيتين (الشبكات العصبية و شجرة اتخاذ القرار) على قاعدة بيانات عالمية معروفة لمرض السكر لتخمين المستقبل من الصفات المعطاة و ملاحظة أثر معالجة القيم المحذوفة بقاعدة البيانات على النتائج.

Abstract EN

Medical data has potential information for extracting hidden patterns in the data sets.

Classification is form of data analysis that can used to extract models describing important data classes or to predict future data trend.

Such analysis can help providing us with a better understanding of the large data.

The diagnosis of a medical from symptoms is one example of classification tasks, in which the classes could be either the various disease states or the possible therapies.

Data cleaning and normalization may improve the accuracy and efficiency of mining algorithms.

In this paper we use two data mining techniques (neural network and decision tree ) on a known diabetic dataset to predict the future from the given attributes, and notice the impact of handling the missing value in the dataset at the results.

American Psychological Association (APA)

Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. 2012. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science،Vol. 30, no. 2A, pp.128-141.
https://search.emarefa.net/detail/BIM-320464

Modern Language Association (MLA)

Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science Vol. 30, no. 2-A (2012), pp.128-141.
https://search.emarefa.net/detail/BIM-320464

American Medical Association (AMA)

Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science. 2012. Vol. 30, no. 2A, pp.128-141.
https://search.emarefa.net/detail/BIM-320464

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 139-141

Record ID

BIM-320464