Influence of noisy environment on the speech recognition rate based on the altera FPGA

Other Title(s)

تأثير البيئة الصاخبة على معدل تمييز الكلام مستند على البوابات المنطقية المبرمجة نوع الليترا

Joint Authors

Abbas, Iyad Ibrahim
Refeis, Ala Abd al-Husayn

Source

Engineering and Technology Journal

Issue

Vol. 31, Issue 13A (31 Aug. 2013), pp.2513-2530, 18 p.

Publisher

University of Technology

Publication Date

2013-08-31

Country of Publication

Iraq

No. of Pages

18

Main Subjects

Electronic engineering

Abstract AR

يقدم هذا البحث مدخلا لدراسة تأثير المستويات المختلفة من الضوضاء البيئية على معدل التمييز لأنظمة تمييز الكلام التي لا تستخدم أي نوع من الفلاتر للتعامل مع هذه القضية.

تم إنجاز هذا العمل بواسطة تنفيذ نظام على رقاقة قابله للبرمجة مع معالج التيرا نيوس 2 لتمييز الكلام في الزمن الحقيقي.

استخدمت تقنية معاملات نغمة طيف التردد كوسيلة لاستخراج خواص إشارة الصوت (المتجهات الظاهرة).

نمذجة المتجهات الظاهرة لمعلومات الصوت باستخدام نموذج خليط كاوسين، هذا الموديل يمرر إلى نموذج ماركوف المخفي كموديل إحتمالي لمعالجة نموذج خليط كاوسين إحصائيا لإتخاذ القرار لتمييز الكلمات المنطوقة، سواء كانت الكلمات منفردة أو مركبة، من مقطع صوتي واحد أو أكثر.

تم تنفيذ العمل على رقاقة البوابات المنطقية المبرمجة نوع سايكلون 2 (EP2C70F896CN6) موضوعة على لوحة التطوير نوع التيرا DE2-70.

البرامج الخدمية المستخدمة لبناء المكونات المادية.

كل كلمة تخزن في الذاكرة النظام على شكل مصفوفة إنتقالية و مجموعة مصفوفات التغايير القطرية و متجهات الوسط الحسابي.

كل كلمة تأخذ حجم مساوي إلى 4.45 كيلزبايت بغض النظر عن طول الكلمة.

معدل تمييز الكلمات (رقم صفر إلى رقم عشرة بالإنكليزية) تعطى نسبة 100 % للشخص المتحدث.

أجري الإختبار في مستويات مختلفة من الأصوات المحيطة (53-73 ديسيبل) كما تم قياسها في جهاز قياس مستوى الصوت.

Abstract EN

This paper introduce an approach to study the effects of different levels of environment noise on the recognition rate of speech recognition systems, which are not used any type of filters to deal with this issue.

This is achieved by implementing an embedded SoPC (System on a Programmable Chip) technique with Altera Nios II processor for real-time speech recognition system.

Mel Frequency Cepstral Coefficients (MFCCs) technique was used for speech signal feature extraction (observation vector).

Model the observation vector of voice information by using Gaussian Mixture Model (GMM), this model passed to the Hidden Markov Model (HMM) as probabilistic model to process the GMM statistically to make decision on utterance words recognition, whether a single or composite, one or more syllable words.

The framework was implemented on Altera Cyclone II EP2C70F896C6N FPGA chip sitting on ALTERA DE2-70 Development Board.

Each word model (template) stored as Transition Matrix, Diagonal Covariance Matrices, and Mean Vectors in the system memory.

Each word model utilizes only 4.45Kbytes regardless of the spoken word length.

Recognition words rate (digit / 0 to digit / 10) given 100 % for the individual speaker.

The test was conducted at different sound levels of the surrounding environment (53dB to 73dB) as measured by Sound Level Meter (SLM) instrument.

American Psychological Association (APA)

Abbas, Iyad Ibrahim& Refeis, Ala Abd al-Husayn. 2013. Influence of noisy environment on the speech recognition rate based on the altera FPGA. Engineering and Technology Journal،Vol. 31, no. 13A, pp.2513-2530.
https://search.emarefa.net/detail/BIM-345691

Modern Language Association (MLA)

Abbas, Iyad Ibrahim& Refeis, Ala Abd al-Husayn. Influence of noisy environment on the speech recognition rate based on the altera FPGA. Engineering and Technology Journal Vol. 31, no. 13 A (2013), pp.2513-2530.
https://search.emarefa.net/detail/BIM-345691

American Medical Association (AMA)

Abbas, Iyad Ibrahim& Refeis, Ala Abd al-Husayn. Influence of noisy environment on the speech recognition rate based on the altera FPGA. Engineering and Technology Journal. 2013. Vol. 31, no. 13A, pp.2513-2530.
https://search.emarefa.net/detail/BIM-345691

Data Type

Journal Articles

Language

English

Notes

Includes appendices : p. 2522-2530

Record ID

BIM-345691