On Multilabel Classification Methods of Incompletely Labeled Biomedical Text Data
المؤلفون المشاركون
Kolesov, Anton
Golovizin, Alexey
Smekalova, Elena
Kamyshenkov, Dmitry
Zhavoronkov, Alex
Litovchenko, Maria
المصدر
Computational and Mathematical Methods in Medicine
العدد
المجلد 2014، العدد 2014 (31 ديسمبر/كانون الأول 2014)، ص ص. 1-11، 11ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2014-01-23
دولة النشر
مصر
عدد الصفحات
11
التخصصات الرئيسية
الملخص EN
Multilabel classification is often hindered by incompletely labeled training datasets; for some items of such dataset (or even for all of them) some labels may be omitted.
In this case, we cannot know if any item is labeled fully and correctly.
When we train a classifier directly on incompletely labeled dataset, it performs ineffectively.
To overcome the problem, we added an extra step, training set modification, before training a classifier.
In this paper, we try two algorithms for training set modification: weighted k-nearest neighbor (WkNN) and soft supervised learning (SoftSL).
Both of these approaches are based on similarity measurements between data vectors.
We performed the experiments on AgingPortfolio (text dataset) and then rechecked on the Yeast (nontext genetic data).
We tried SVM and RF classifiers for the original datasets and then for the modified ones.
For each dataset, our experiments demonstrated that both classification algorithms performed considerably better when preceded by the training set modification step.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Kolesov, Anton& Kamyshenkov, Dmitry& Litovchenko, Maria& Smekalova, Elena& Golovizin, Alexey& Zhavoronkov, Alex. 2014. On Multilabel Classification Methods of Incompletely Labeled Biomedical Text Data. Computational and Mathematical Methods in Medicine،Vol. 2014, no. 2014, pp.1-11.
https://search.emarefa.net/detail/BIM-497551
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Kolesov, Anton…[et al.]. On Multilabel Classification Methods of Incompletely Labeled Biomedical Text Data. Computational and Mathematical Methods in Medicine No. 2014 (2014), pp.1-11.
https://search.emarefa.net/detail/BIM-497551
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Kolesov, Anton& Kamyshenkov, Dmitry& Litovchenko, Maria& Smekalova, Elena& Golovizin, Alexey& Zhavoronkov, Alex. On Multilabel Classification Methods of Incompletely Labeled Biomedical Text Data. Computational and Mathematical Methods in Medicine. 2014. Vol. 2014, no. 2014, pp.1-11.
https://search.emarefa.net/detail/BIM-497551
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-497551
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر