Automatic speech segmentation using hybrid wavelet features and HMM
العناوين الأخرى
التقطيع الأوتوماتيكي للصوت باستخدام نموذج مهجن
المؤلفون المشاركون
Shaban, Manal
Judi, Amr Muhammad Rifat
المصدر
The Egyptian Journal of Language Engineering
العدد
المجلد 3، العدد 2 (30 سبتمبر/أيلول 2016)، ص ص. 1-13، 13ص.
الناشر
تاريخ النشر
2016-09-30
دولة النشر
مصر
عدد الصفحات
13
التخصصات الرئيسية
العلوم الهندسية والتكنولوجية (متداخلة التخصصات)
الملخص EN
In this research, a novel feature set is used to automatically segment speech signal.
Automatic segmentation is very useful especially for large database.
A hybrid features model is created from wavelet packet analysis and mel-scale is used to train Hidden Markov Model (HMM) for phone boundary detection.
HMM is implemented using the Hidden Markov Model Toolkit (HTK).The database (Ked-TIMIT) is used for result verifications and Mel Frequency Cepstral Coefficients (MFCC) is used as reference for evaluating the results of the proposed Hybrid model.
The results are categorized for vowels, consonants and short phones.
Phone duration and start location are used as metrics to evaluate the system success rate.
Success rate of 74% is achieved for consonant detection, 72% for vowel detection and 58% for short phone detection.
Using the simple metric that relies only on boundary locations but ignoring duration, the achieved results are 92.5% for consonant detection, 90% for vowel detection and 77.5% for short phoneme detection.
In addition to boundary detection the proposed hybrid model is utilized to compare newly developed features called Mel scale Best Tree Encoding (Mel-BTE ) to the mostly used popular features MFCC along with all experiments using the same database.
The relative results for Mel-BTE with respect to MFCC are 94.77% for consonant detection, 87.5% for vowel detection and 93.33% for short phoneme detection.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Judi, Amr Muhammad Rifat& Shaban, Manal& Salih, Amr. 2016. Automatic speech segmentation using hybrid wavelet features and HMM. The Egyptian Journal of Language Engineering،Vol. 3, no. 2, pp.1-13.
https://search.emarefa.net/detail/BIM-941687
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Salih, Amr…[et al.]. Automatic speech segmentation using hybrid wavelet features and HMM. The Egyptian Journal of Language Engineering Vol. 3, no. 2 (Sep. 2016), pp.1-13.
https://search.emarefa.net/detail/BIM-941687
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Judi, Amr Muhammad Rifat& Shaban, Manal& Salih, Amr. Automatic speech segmentation using hybrid wavelet features and HMM. The Egyptian Journal of Language Engineering. 2016. Vol. 3, no. 2, pp.1-13.
https://search.emarefa.net/detail/BIM-941687
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
رقم السجل
BIM-941687
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر