Optimal entropy to enhance the structure of the wavelet-packets-best-tree for automatic speech recognition
العناوين الأخرى
البحث عن الإنتروبي الأمثل لتحسين بنية الشجرة المثلى لحزمة المويجات لإنتاج ميزات أكثر ملاءمة لمهمة التعرف الآلي على
المؤلفون المشاركون
Judi, Amr Muhammad Rifat
Abd al-Latif, Fatimah Muhammad
Ahmad, Walid Abd al-Majid
المصدر
The Egyptian Journal of Language Engineering
العدد
المجلد 8، العدد 2 (30 سبتمبر/أيلول 2021)، ص ص. 1-15، 15ص.
الناشر
تاريخ النشر
2021-09-30
دولة النشر
مصر
عدد الصفحات
15
التخصصات الرئيسية
الموضوعات
الملخص EN
Best Tree Encoding (BTE)is a promising feature extraction technique based on wavelet packet decomposition that is utilized in Automatic Speech Recognition(ASR).
This research introduces an enhancement of Wavelet Packet Best Tree(WPBT) Calculations.
The standard features BTE encodes the tree structure using a mathematical model into a features vector of 4 components.
The best tree structure has been calculated using the entropy function.
In the standard version of BTE, Shannon entropy has been chosen as the entropy function.
In this research, Shannon Entropy (SE), Renyi Entropy (RE), and Tsallis Entropy (TE) are used to construct the Best Tree.
The encoding of the Best Tree has been done using the same mathematical model approach in the standard 4-Point BTE.
The proposed model is tested and Verified against the most widely used feature Mel Frequency Cepstral Coefficient (MFCC) plus delta and delta-delta coefficients (39 parameters) to evaluate its performance.
The TIMIT database is used in this research.
All phones are divided into five classes: Vowels, Fricatives, Silences, Nasals, and Plosives.
The acoustical model has been implemented using Hidden Markov Model (HMM).
No language model has been applied.
The HMM Tool Kit (HTK) software is used for model implementation.
The experiments show that BTE using Tsallis entropy yields the highest overall success rate of 75.85% which is better than MFCC's overall success rate of 71.76% .
Comparing the vector of 4 components of BTE to the 39 components vector of MFCC makes it a very promising feature vector to be considered for research and development.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Abd al-Latif, Fatimah Muhammad& Judi, Amr Muhammad Rifat& Ahmad, Walid Abd al-Majid. 2021. Optimal entropy to enhance the structure of the wavelet-packets-best-tree for automatic speech recognition. The Egyptian Journal of Language Engineering،Vol. 8, no. 2, pp.1-15.
https://search.emarefa.net/detail/BIM-1307142
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Abd al-Latif, Fatimah Muhammad…[et al.]. Optimal entropy to enhance the structure of the wavelet-packets-best-tree for automatic speech recognition. The Egyptian Journal of Language Engineering Vol. 8, no. 2 (Sep. 2021), pp.1-15.
https://search.emarefa.net/detail/BIM-1307142
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Abd al-Latif, Fatimah Muhammad& Judi, Amr Muhammad Rifat& Ahmad, Walid Abd al-Majid. Optimal entropy to enhance the structure of the wavelet-packets-best-tree for automatic speech recognition. The Egyptian Journal of Language Engineering. 2021. Vol. 8, no. 2, pp.1-15.
https://search.emarefa.net/detail/BIM-1307142
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
-
رقم السجل
BIM-1307142
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر