QSDAS : new Quranic speech database for Arabic speaker recognition

المؤلفون المشاركون

Harrag, A.
Muhammadi, T.

المصدر

The Arabian Journal for Science and Engineering. Section C, Theme issues

العدد

المجلد 35، العدد 2C(s) (31 ديسمبر/كانون الأول 2010)، ص ص. 8-19، 12ص.

الناشر

جامعة الملك فهد للبترول و المعادن

تاريخ النشر

2010-12-31

دولة النشر

السعودية

عدد الصفحات

12

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

تعد قاعدة البيانات المستعملة في تطوير برامج أو نظام التعرف على الأشخاص من أهم الوحدات المكونة لهذا الأخير.

و للاستجابة لكافة متطلبات هذا النظام قمنا بتطوير قاعدة بيانات قرآنية للأشخاص الناطقين بالعربية.

تكمن أهمية هذه القاعدة في التمكين من تطوير بحوث التعرف على الأشخاص و البحوث اللغوية، و هي تحتوي على 15.4 جيقابايت تمثل 6489 ملف تحوي في طياتها 1617 ملفا (سورة) مقروءة من طرف 77 شخصا من الذكور.

و الملفات الصوتية 1617 قسمت إلى ثلاثة أقسام يحتوي كل قسم منها 77، 770، 770 ملفا على الترتيب.

الأول يحوي ملفا لكل شخص و يستعمل للتطوير، و الباقي يحوي كل واحد منهما على 10 ملفات لكل شخص و تستعمل للتجريب.

و زيادة على 1617 ملفا صوتيا، تشتمل قاعدة كل ملف صوتي ثلاثة ملفات هي : ملف للاهتزاز الرئيسي للأحبال الصوتية، و ملف لترددات الرنين في الجهاز الصوتي إلى جانب معلومات في المجالين الزمني و الترددي لجعل هذه القاعدة جاهزة للاستعمال حينا في مجال التعرف على الأشخاص.

الملخص EN

-A speech database is the foundation for developing any speaker processing system or algorithm.

To cope with various requirements to speaker recognition technology, the Quranic Speech Database for Arabic Speakers (QSDAS) has been produced.

This database is a useful resource to aid in the assessment of Arabic speaker recognition and linguistic research.

It consists of 15.4 GB representing 6489 files, including 1617 files (Surahs) read aloud by 77 male speakers.

The 1617 audio files (6.4 GB) are partitioned in three sets: SetD, SetS, and SetT with 77, 770, and 770 audio files, respectively.

SetD contains one file per speaker used for development, while SetS and SetT contain ten files per speaker and are used for tests purposes.

In addition to the 1617 audio files, QSDAS includes for each audio file the corresponding fundamental frequency F0, F1-F2-F3 formants file, and MFCC and Energy file to make it usable immediately for speaker recognition research.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Harrag, A.& Muhammadi, T.. 2010. QSDAS : new Quranic speech database for Arabic speaker recognition. The Arabian Journal for Science and Engineering. Section C, Theme issues،Vol. 35, no. 2C(s), pp.8-19.
https://search.emarefa.net/detail/BIM-308343

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Harrag, A.& Muhammadi, T.. QSDAS : new Quranic speech database for Arabic speaker recognition. The Arabian Journal for Science and Engineering. Section C, Theme issues Vol. 35, no. 2C(s) (Dec. 2010), pp.8-19.
https://search.emarefa.net/detail/BIM-308343

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Harrag, A.& Muhammadi, T.. QSDAS : new Quranic speech database for Arabic speaker recognition. The Arabian Journal for Science and Engineering. Section C, Theme issues. 2010. Vol. 35, no. 2C(s), pp.8-19.
https://search.emarefa.net/detail/BIM-308343

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes appendix : p. 19

رقم السجل

BIM-308343