A data oriented approach to assess the accuracy of a protein secondary structure predictor

المؤلف

Sabri, Sad

المصدر

Journal of Science and Technology : in Engineering and Computer Sciences

العدد

المجلد 16، العدد 2 (31 ديسمبر/كانون الأول 2015)، ص ص. 21-27، 7ص.

الناشر

جامعة السودان للعلوم و التكنولوجيا عمادة البحث العلمي

تاريخ النشر

2015-12-31

دولة النشر

السودان

عدد الصفحات

7

التخصصات الرئيسية

الأحياء

الموضوعات

الملخص AR

نهج موجه نحو البيانات لاختيار أسلوب التنبؤ ببنية البروتين الثانوية: الباحثون في مجال التنبؤ ببنية البروتين الثانوية يستخدمون ثلاث اشكال من الهياكل الثانوية، و هي : اللوالب ألفا (H) بيتا (E) والملفوفات (C).

سلسلة الاحماض الامينية التي ترتبط معا في سلاسل مجاورة تعرف باسم البروتينات.

التنبؤ ببنية البروتين الثانوية هو خطوة أساسية في تحديد هيكل و وظائف البروتين النهائية.

استلهم هذا العمل من تجربة لتطوير آلة التنبؤ ببنية البروتين الثانوية.

من خلال التحقيق في مجموعات بيانات الاحماض الامينية، لوحظ أن البيانات تنقسم إلى مجموعتين اثنين تقريبا 50 % لكل منهما.

و بالتالي، يتم تبني طريقة جديدة للنظر إلى مجموعة البيانات.

لهذا النوع بحيث أن البيانات تنقسم إلى مجموعتان و ليست ثلاثة.

و استخدم (ROC) لتحليل و تفسير النتائج.

و كشفت النتائج أن التحليل ROC أظهر نتائج مماثلة لتلك التي تم الحصول عليها باستخدام أساليب التصنيف الأخرى غير ROC.

و كانت ROC قادرة على التمييز بنسبة 72 %.

الملخص EN

Researchers in the field of protein secondary structure prediction use typical three states of secondary structures, namely: alpha helices (H) beta strands (E), and coils (C).

The series of amino acids polymers linked together into adjacent chains are known as proteins.

Protein secondary structure prediction is a fundamental step in determining the final structure and functions of a protein.

In this work we developed a prediction machine for protein secondary structure.

By investigating the amino acids benchmark data sets, it was observed that the data is grouped into two distinct states or groups almost 50% each.

In this scheme, researchers classify any state which is not classified as helix or strands as coils.

Hence, in this work a new way of looking to the data set is adopted.

For this type of data, the Receiver Operating Characteristic (ROC) analysis is considered for analysing and interpreting the results of assessing the protein secondary structure classifier.

The results revealed that ROC analysis showed similar results to that obtained using other non ROC classification methods.

The ROC curves were able to discriminate the coil states from non-coil states by 72% prediction accuracy with very small standard error.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Sabri, Sad. 2015. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences،Vol. 16, no. 2, pp.21-27.
https://search.emarefa.net/detail/BIM-439973

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Sabri, Sad. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences Vol. 16, no. 2 (2015), pp.21-27.
https://search.emarefa.net/detail/BIM-439973

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Sabri, Sad. A data oriented approach to assess the accuracy of a protein secondary structure predictor. Journal of Science and Technology : in Engineering and Computer Sciences. 2015. Vol. 16, no. 2, pp.21-27.
https://search.emarefa.net/detail/BIM-439973

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 26-27

رقم السجل

BIM-439973