Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques
العناوين الأخرى
دراسة أثر معالجة القيم المحذوفة في قاعدة البيانات على كفاءة تقنيات تنقيب البيانات
المؤلفون المشاركون
Hasan, Bushra Muhammad
al-Suhal, Ghayda Abd al-Razzaq
المصدر
العدد
المجلد 30، العدد 2A (30 سبتمبر/أيلول 2012)، ص ص. 128-141، 14ص.
الناشر
تاريخ النشر
2012-09-30
دولة النشر
العراق
عدد الصفحات
14
التخصصات الرئيسية
الموضوعات
الملخص AR
البيانات الطبية تمتلك معلومات كامنة لاستخلاص أنماط مخبأة في قواعد البيانات. التصنيف هو شكل من تحليل البيانات لاستخلاص أنماط لوصف أصناف البيانات المهمة أو لتخمين اتجاه البيانات المستقبلي بعض التحليلات تساعد بتزويدنا بفهم جيد للبيانات الكبيرة التشخيص الطبي من الأعراض، هو أحد الأمثلة من مهمات التصنيف التي تكون فيها الأصناف الناتجة آما حالات المرض المختلفة أو الحالة الممكنة. تنظيف البيانات و تسويتها يحسن الدقة و الكفاءة في خوارزميات التنقيب. في هذا البحث تم استخدام تقنيتين (الشبكات العصبية و شجرة اتخاذ القرار) على قاعدة بيانات عالمية معروفة لمرض السكر لتخمين المستقبل من الصفات المعطاة و ملاحظة أثر معالجة القيم المحذوفة بقاعدة البيانات على النتائج.
الملخص EN
Medical data has potential information for extracting hidden patterns in the data sets.
Classification is form of data analysis that can used to extract models describing important data classes or to predict future data trend.
Such analysis can help providing us with a better understanding of the large data.
The diagnosis of a medical from symptoms is one example of classification tasks, in which the classes could be either the various disease states or the possible therapies.
Data cleaning and normalization may improve the accuracy and efficiency of mining algorithms.
In this paper we use two data mining techniques (neural network and decision tree ) on a known diabetic dataset to predict the future from the given attributes, and notice the impact of handling the missing value in the dataset at the results.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. 2012. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science،Vol. 30, no. 2A, pp.128-141.
https://search.emarefa.net/detail/BIM-320464
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science Vol. 30, no. 2-A (2012), pp.128-141.
https://search.emarefa.net/detail/BIM-320464
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Hasan, Bushra Muhammad& al-Suhal, Ghayda Abd al-Razzaq. Studying the impact of handling the missing values on the dataset on the efficiency of data mining techniques. Basrah Journal of Science. 2012. Vol. 30, no. 2A, pp.128-141.
https://search.emarefa.net/detail/BIM-320464
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 139-141
رقم السجل
BIM-320464
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر