Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques

العناوين الأخرى

دراسة أثر معالجة القيم المحذوفة في قاعدة البيانات على كفاءة تقنيات تنقيب البيانات

المؤلفون المشاركون

Hasan, Bushra Muhammad
al-Suhal, Ghayda Abd al-Razzaq

المصدر

Basrah Journal of Science

العدد

المجلد 30، العدد 2A (30 سبتمبر/أيلول 2012)، ص ص. 128-141، 14ص.

الناشر

جامعة البصرة كلية العلوم

تاريخ النشر

2012-09-30

دولة النشر

العراق

عدد الصفحات

14

التخصصات الرئيسية

الرياضيات

الموضوعات

الملخص AR

البيانات الطبية تمتلك معلومات كامنة لاستخلاص أنماط مخبأة في قواعد البيانات. التصنيف هو شكل من تحليل البيانات لاستخلاص أنماط لوصف أصناف البيانات المهمة أو لتخمين اتجاه البيانات المستقبلي بعض التحليلات تساعد بتزويدنا بفهم جيد للبيانات الكبيرة التشخيص الطبي من الأعراض، هو أحد الأمثلة من مهمات التصنيف التي تكون فيها الأصناف الناتجة آما حالات المرض المختلفة أو الحالة الممكنة. تنظيف البيانات و تسويتها يحسن الدقة و الكفاءة في خوارزميات التنقيب. في هذا البحث تم استخدام تقنيتين (الشبكات العصبية و شجرة اتخاذ القرار) على قاعدة بيانات عالمية معروفة لمرض السكر لتخمين المستقبل من الصفات المعطاة و ملاحظة أثر معالجة القيم المحذوفة بقاعدة البيانات على النتائج.

الملخص EN

Medical data has potential information for extracting hidden patterns in the data sets.

Classification is form of data analysis that can used to extract models describing important data classes or to predict future data trend.

Such analysis can help providing us with a better understanding of the large data.

The diagnosis of a medical from symptoms is one example of classification tasks, in which the classes could be either the various disease states or the possible therapies.

Data cleaning and normalization may improve the accuracy and efficiency of mining algorithms.

In this paper we use two data mining techniques (neural network and decision tree ) on a known diabetic dataset to predict the future from the given attributes, and notice the impact of handling the missing value in the dataset at the results.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. 2012. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science،Vol. 30, no. 2A, pp.128-141.
https://search.emarefa.net/detail/BIM-320464

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science Vol. 30, no. 2-A (2012), pp.128-141.
https://search.emarefa.net/detail/BIM-320464

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science. 2012. Vol. 30, no. 2A, pp.128-141.
https://search.emarefa.net/detail/BIM-320464

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 139-141

رقم السجل

BIM-320464