A data oriented approach to assess the accuracy of a protein secondary structure predictor
Author
Source
Journal of Science and Technology : in Engineering and Computer Sciences
Issue
Vol. 16, Issue 2 (31 Dec. 2015), pp.21-27, 7 p.
Publisher
Sudan University of Science and Technology Deanship of Scientific Research
Publication Date
2015-12-31
Country of Publication
Sudan
No. of Pages
7
Main Subjects
Topics
Abstract AR
نهج موجه نحو البيانات لاختيار أسلوب التنبؤ ببنية البروتين الثانوية: الباحثون في مجال التنبؤ ببنية البروتين الثانوية يستخدمون ثلاث اشكال من الهياكل الثانوية، و هي : اللوالب ألفا (H) بيتا (E) والملفوفات (C).
سلسلة الاحماض الامينية التي ترتبط معا في سلاسل مجاورة تعرف باسم البروتينات.
التنبؤ ببنية البروتين الثانوية هو خطوة أساسية في تحديد هيكل و وظائف البروتين النهائية.
استلهم هذا العمل من تجربة لتطوير آلة التنبؤ ببنية البروتين الثانوية.
من خلال التحقيق في مجموعات بيانات الاحماض الامينية، لوحظ أن البيانات تنقسم إلى مجموعتين اثنين تقريبا 50 % لكل منهما.
و بالتالي، يتم تبني طريقة جديدة للنظر إلى مجموعة البيانات.
لهذا النوع بحيث أن البيانات تنقسم إلى مجموعتان و ليست ثلاثة.
و استخدم (ROC) لتحليل و تفسير النتائج.
و كشفت النتائج أن التحليل ROC أظهر نتائج مماثلة لتلك التي تم الحصول عليها باستخدام أساليب التصنيف الأخرى غير ROC.
و كانت ROC قادرة على التمييز بنسبة 72 %.
Abstract EN
Researchers in the field of protein secondary structure prediction use typical three states of secondary structures, namely: alpha helices (H) beta strands (E), and coils (C).
The series of amino acids polymers linked together into adjacent chains are known as proteins.
Protein secondary structure prediction is a fundamental step in determining the final structure and functions of a protein.
In this work we developed a prediction machine for protein secondary structure.
By investigating the amino acids benchmark data sets, it was observed that the data is grouped into two distinct states or groups almost 50% each.
In this scheme, researchers classify any state which is not classified as helix or strands as coils.
Hence, in this work a new way of looking to the data set is adopted.
For this type of data, the Receiver Operating Characteristic (ROC) analysis is considered for analysing and interpreting the results of assessing the protein secondary structure classifier.
The results revealed that ROC analysis showed similar results to that obtained using other non ROC classification methods.
The ROC curves were able to discriminate the coil states from non-coil states by 72% prediction accuracy with very small standard error.
American Psychological Association (APA)
Sabri, Sad. 2015. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences،Vol. 16, no. 2, pp.21-27.
https://search.emarefa.net/detail/BIM-439973
Modern Language Association (MLA)
Sabri, Sad. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences Vol. 16, no. 2 (2015), pp.21-27.
https://search.emarefa.net/detail/BIM-439973
American Medical Association (AMA)
Sabri, Sad. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences. 2015. Vol. 16, no. 2, pp.21-27.
https://search.emarefa.net/detail/BIM-439973
Data Type
Journal Articles
Language
English
Notes
Includes bibliographical references : p. 26-27
Record ID
BIM-439973