Novel image preprocessing approach for automatic speech recognition
العناوين الأخرى
طريقة مبتكرة للمعالجة الاستباقية للإشارة لغرض التعرف التقاني على الكلام باستخدام نموذج يعتمد على معالجة الصور
المؤلفون المشاركون
Imam, Yusra Abd al-Munim
Husayn, Nashat Muhammad
Judi, Amr Muhammad Rifat
المصدر
The Egyptian Journal of Language Engineering
العدد
المجلد 5، العدد 2 (30 سبتمبر/أيلول 2018)، ص ص. 1-15، 15ص.
الناشر
تاريخ النشر
2018-09-30
دولة النشر
مصر
عدد الصفحات
15
التخصصات الرئيسية
الملخص EN
:This research is intending to provide a novel approach of manipulating automatic speech recognition using image recognition approach.
This research introduces hybrid 2D-Image-Hidden Markov Model(2DI)-(HMM) approach to handle preprocessing classification task in Automatic Speech Recognition System (ASR).
The focus in this research is in the classification task.
Due to that the proposed approach is novel and is a task in the whole ASR, it is evaluated using relative comparison to other popular approaches to run the same task on the same database.
The relative comparison with hybrid Gaussian Mixture (GMM)-HMM with Mel Frequency Cepstral (MFCC) features is considered as reference results.
This research introduces a new method of mapping speech signal into two-dimensionalspace.
Speech stream is segmented and then the frequency contents are projected into frequency domain using a balanced tree structure filter.
The wavelet packets technique is used to implement the filtering.
The tree structure is captured into image.
Database is constructed of encoded images.
The imagesthenare segregated into speech classes.
Hybrid Discrete Cosine Transform (DCT) based featuresare used for image encoding with (HMM) as Class model is evaluated against MFCC-HMM for the same classification problem.
The proposed hybrid model indicates better balanced results over MFCC-HMM for handling the different classes.
The considered classes in this research are vowels, consonants, plosives and speech silence.
KED-TIMITCorpus is used in this research as source of speech information.
This approach is indicating promising results especiallyin Silence and vowels detection.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Judi, Amr Muhammad Rifat& Imam, Yusra Abd al-Munim& Husayn, Nashat Muhammad. 2018. Novel image preprocessing approach for automatic speech recognition. The Egyptian Journal of Language Engineering،Vol. 5, no. 2, pp.1-15.
https://search.emarefa.net/detail/BIM-942849
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Judi, Amr Muhammad Rifat…[et al.]. Novel image preprocessing approach for automatic speech recognition. The Egyptian Journal of Language Engineering Vol. 5, no. 2 (Sep. 2018), pp.1-15.
https://search.emarefa.net/detail/BIM-942849
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Judi, Amr Muhammad Rifat& Imam, Yusra Abd al-Munim& Husayn, Nashat Muhammad. Novel image preprocessing approach for automatic speech recognition. The Egyptian Journal of Language Engineering. 2018. Vol. 5, no. 2, pp.1-15.
https://search.emarefa.net/detail/BIM-942849
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
رقم السجل
BIM-942849
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر