An optimized model for visual speech recognition using HMM
المؤلفون المشاركون
Paramasivam, Sujatha
Murugesanadar, Radhakrishnan
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 15، العدد 2 (31 مارس/آذار 2018)9ص.
الناشر
تاريخ النشر
2018-03-31
دولة النشر
الأردن
عدد الصفحات
9
التخصصات الرئيسية
الملخص EN
Visual Speech Recognition (VSR) is to identify spoken words from visual data only without the corresponding acoustic signals.
It is useful in situations in which conventional audio processing is ineffective like very noisy environments or impossible like unavailability of audio signals.
In this paper, an optimized model for VSR is introduced which proposes simple geometric projection method for mouth localization that reduces the computation time.
16-point distance method and chain code method are used to extract the visual features and its recognition performance is compared using the classifier Hidden Markov Model (HMM).
To optimize the model, more prominent features are selected from a large set of extracted visual attributes using Discrete Cosine Transform (DCT).
The experiments were conducted on an in-house database of 10 digits [1 to 10] taken from 10 subjects and tested with 10-fold cross validation technique.
Also, the model is evaluated based on the metrics specificity, sensitivity and accuracy.
Unlike other models in the literature, the proposed method is more robust to subject variations with high sensitivity and specificity for the digits 1 to 10.
The result shows that the combination of 16-point distance method and DCT gives better results than only 16-point distance method and chain code method.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Paramasivam, Sujatha& Murugesanadar, Radhakrishnan. 2018. An optimized model for visual speech recognition using HMM. The International Arab Journal of Information Technology،Vol. 15, no. 2.
https://search.emarefa.net/detail/BIM-838612
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Paramasivam, Sujatha& Murugesanadar, Radhakrishnan. An optimized model for visual speech recognition using HMM. The International Arab Journal of Information Technology Vol. 15, no. 2 (Mar. 2018).
https://search.emarefa.net/detail/BIM-838612
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Paramasivam, Sujatha& Murugesanadar, Radhakrishnan. An optimized model for visual speech recognition using HMM. The International Arab Journal of Information Technology. 2018. Vol. 15, no. 2.
https://search.emarefa.net/detail/BIM-838612
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes appendix.
رقم السجل
BIM-838612
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر