A data oriented approach to assess the accuracy of a protein secondary structure predictor

Author

Sabri, Sad

Source

Journal of Science and Technology : in Engineering and Computer Sciences

Issue

Vol. 16, Issue 2 (31 Dec. 2015), pp.21-27, 7 p.

Publisher

Sudan University of Science and Technology Deanship of Scientific Research

Publication Date

2015-12-31

Country of Publication

Sudan

No. of Pages

7

Main Subjects

Biology

Topics

Abstract AR

نهج موجه نحو البيانات لاختيار أسلوب التنبؤ ببنية البروتين الثانوية: الباحثون في مجال التنبؤ ببنية البروتين الثانوية يستخدمون ثلاث اشكال من الهياكل الثانوية، و هي : اللوالب ألفا (H) بيتا (E) والملفوفات (C).

سلسلة الاحماض الامينية التي ترتبط معا في سلاسل مجاورة تعرف باسم البروتينات.

التنبؤ ببنية البروتين الثانوية هو خطوة أساسية في تحديد هيكل و وظائف البروتين النهائية.

استلهم هذا العمل من تجربة لتطوير آلة التنبؤ ببنية البروتين الثانوية.

من خلال التحقيق في مجموعات بيانات الاحماض الامينية، لوحظ أن البيانات تنقسم إلى مجموعتين اثنين تقريبا 50 % لكل منهما.

و بالتالي، يتم تبني طريقة جديدة للنظر إلى مجموعة البيانات.

لهذا النوع بحيث أن البيانات تنقسم إلى مجموعتان و ليست ثلاثة.

و استخدم (ROC) لتحليل و تفسير النتائج.

و كشفت النتائج أن التحليل ROC أظهر نتائج مماثلة لتلك التي تم الحصول عليها باستخدام أساليب التصنيف الأخرى غير ROC.

و كانت ROC قادرة على التمييز بنسبة 72 %.

Abstract EN

Researchers in the field of protein secondary structure prediction use typical three states of secondary structures, namely: alpha helices (H) beta strands (E), and coils (C).

The series of amino acids polymers linked together into adjacent chains are known as proteins.

Protein secondary structure prediction is a fundamental step in determining the final structure and functions of a protein.

In this work we developed a prediction machine for protein secondary structure.

By investigating the amino acids benchmark data sets, it was observed that the data is grouped into two distinct states or groups almost 50% each.

In this scheme, researchers classify any state which is not classified as helix or strands as coils.

Hence, in this work a new way of looking to the data set is adopted.

For this type of data, the Receiver Operating Characteristic (ROC) analysis is considered for analysing and interpreting the results of assessing the protein secondary structure classifier.

The results revealed that ROC analysis showed similar results to that obtained using other non ROC classification methods.

The ROC curves were able to discriminate the coil states from non-coil states by 72% prediction accuracy with very small standard error.

American Psychological Association (APA)

Sabri, Sad. 2015. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences،Vol. 16, no. 2, pp.21-27.
https://search.emarefa.net/detail/BIM-439973

Modern Language Association (MLA)

Sabri, Sad. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences Vol. 16, no. 2 (2015), pp.21-27.
https://search.emarefa.net/detail/BIM-439973

American Medical Association (AMA)

Sabri, Sad. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences. 2015. Vol. 16, no. 2, pp.21-27.
https://search.emarefa.net/detail/BIM-439973

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 26-27

Record ID

BIM-439973