Identifying Human Phenotype Terms by Combining Machine Learning and Validation Rules
المؤلفون المشاركون
Couto, Francisco M.
Lobo, Manuel
Lamurias, Andre
المصدر
العدد
المجلد 2017، العدد 2017 (31 ديسمبر/كانون الأول 2017)، ص ص. 1-8، 8ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2017-11-09
دولة النشر
مصر
عدد الصفحات
8
التخصصات الرئيسية
الملخص EN
Named-Entity Recognition is commonly used to identify biological entities such as proteins, genes, and chemical compounds found in scientific articles.
The Human Phenotype Ontology (HPO) is an ontology that provides a standardized vocabulary for phenotypic abnormalities found in human diseases.
This article presents the Identifying Human Phenotypes (IHP) system, tuned to recognize HPO entities in unstructured text.
IHP uses Stanford CoreNLP for text processing and applies Conditional Random Fields trained with a rich feature set, which includes linguistic, orthographic, morphologic, lexical, and context features created for the machine learning-based classifier.
However, the main novelty of IHP is its validation step based on a set of carefully crafted manual rules, such as the negative connotation analysis, that combined with a dictionary can filter incorrectly identified entities, find missed entities, and combine adjacent entities.
The performance of IHP was evaluated using the recently published HPO Gold Standardized Corpora (GSC), where the system Bio-LarK CR obtained the best F-measure of 0.56.
IHP achieved an F-measure of 0.65 on the GSC.
Due to inconsistencies found in the GSC, an extended version of the GSC was created, adding 881 entities and modifying 4 entities.
IHP achieved an F-measure of 0.863 on the new GSC.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Lobo, Manuel& Lamurias, Andre& Couto, Francisco M.. 2017. Identifying Human Phenotype Terms by Combining Machine Learning and Validation Rules. BioMed Research International،Vol. 2017, no. 2017, pp.1-8.
https://search.emarefa.net/detail/BIM-1139146
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Lobo, Manuel…[et al.]. Identifying Human Phenotype Terms by Combining Machine Learning and Validation Rules. BioMed Research International No. 2017 (2017), pp.1-8.
https://search.emarefa.net/detail/BIM-1139146
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Lobo, Manuel& Lamurias, Andre& Couto, Francisco M.. Identifying Human Phenotype Terms by Combining Machine Learning and Validation Rules. BioMed Research International. 2017. Vol. 2017, no. 2017, pp.1-8.
https://search.emarefa.net/detail/BIM-1139146
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1139146
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر