Apprentissage statistique pour l'extraction de connaissances a partir de donnees sanitaires: essai sur donnees du cancer colorectal

العناوين الأخرى

Tatistical learning for knowledge discovery from health data : essay on colorectal cancer dataset

المؤلفون المشاركون

Bin Amrush, Rashid
Atif, Dalia

المصدر

Revue D'économie et de Statistique Appliquée

العدد

المجلد 17، العدد 3 (31 ديسمبر/كانون الأول 2020)، ص ص. 84-100، 17ص.

الناشر

المدرسة الوطنية العليا للإحصاء و الاقتصاد التطبيقي

تاريخ النشر

2020-12-31

دولة النشر

الجزائر

عدد الصفحات

17

التخصصات الرئيسية

الاقتصاد و التجارة

الموضوعات

الملخص EN

Hospital information systems store increasingly large and heterogeneous data volumes, the one of them is the clinical information system of colorectal cancer (CRC), which is focused on the patient’s folder, we were interested in this work to the knowledge discovery from this informational environment, in the form of prognostic factors acting on the recurrence of the disease.

We worked for that on a sample of patients with histologically proven CRC.

Several steps were then necessary for the KDD process, according to the biomedical data characteristics: the treatment of missing values, the discretization of continuous variables, the preselecting of variables and the rebalancing of classes.

The constructed model exhibited excellent validation performance, with superior sensitivity to specificity.

الملخص FRE

Les systèmes d'information hospitaliers (SIH) stockent des volumes de données de plus en plus importants et hétérogènes, parmi ces derniers figure le SI clinique du cancer colorectal (CCR) qui est centré sur le dossier du malade; nous nous sommes intéressés dans ce travail à l'extraction de connaissances (ECD) de cet environnement informationnel, sous forme de facteurs pronostiques agissant réellement sur la récidive de la maladie, nous avons travaillé pour cela sur un échantillon de patients avec un CCR histologiquement prouvé.

Plusieurs étapes furent alors nécessaires au processus ECD, selon les caractéristiques spécifiques aux données biomédicales à savoir: le traitement des valeurs manquantes, la discrétisation des variables continues, la présélection des variables et le rééquilibrage des classes.

Le modèle construit a présenté d'excellentes performances en validation avec une sensibilité supérieure à la spécificité.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Atif, Dalia& Bin Amrush, Rashid. 2020. Apprentissage statistique pour l'extraction de connaissances a partir de donnees sanitaires: essai sur donnees du cancer colorectal. Revue D'économie et de Statistique Appliquée،Vol. 17, no. 3, pp.84-100.
https://search.emarefa.net/detail/BIM-1062871

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Atif, Dalia& Bin Amrush, Rashid. Apprentissage statistique pour l'extraction de connaissances a partir de donnees sanitaires: essai sur donnees du cancer colorectal. Revue D'économie et de Statistique Appliquée Vol. 17, no. 3 (Dec. 2020), pp.84-100.
https://search.emarefa.net/detail/BIM-1062871

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Atif, Dalia& Bin Amrush, Rashid. Apprentissage statistique pour l'extraction de connaissances a partir de donnees sanitaires: essai sur donnees du cancer colorectal. Revue D'économie et de Statistique Appliquée. 2020. Vol. 17, no. 3, pp.84-100.
https://search.emarefa.net/detail/BIM-1062871

نوع البيانات

مقالات

لغة النص

الفرنسية

الملاحظات

Includes bibliographical references : p. 98-100

رقم السجل

BIM-1062871