Isolated word speech recognition using mixed transform

Other Title(s)

تمييز الكلمات المفصولة بإستخدام التحويلات الخليطة

Joint Authors

Abu al-Lukh, Sadiq Jasim
Abd al-Razzaq, Shahd Mujib

Source

Journal of Engineering

Issue

Vol. 19, Issue 10 (31 Oct. 2013), pp.1271-1286, 16 p.

Publisher

University of Baghdad College of Engineering

Publication Date

2013-10-31

Country of Publication

Iraq

No. of Pages

16

Main Subjects

Electronic engineering

Abstract AR

طرائق تمييز الكلام كان موضوع كثير من الدراسات خلال العقد الماضي.

الكلام هو الطريقة الطبيعية للتواصل بين البشر و يعتبر تمييز الكلام واحد من المجالات المهمة في معالجة الإشارة.

التحويلات الخليطة هي أداة مفيدة في معالجة إشارة الكلام، و قد تم تطويرها من أجل تحسين تمثيل الإشارة المستخلصة.

يتضمن تمييز الكلام ثلاث أجزاء أساسية : معالجة مسبقة للإشارة، استخلاص الميزات، و التصنيف.

تتأثر دقة تمييز الكلام بمرحلة استخلاص الميزات لذلك فقد تم اقتراح نماذج مختلفة من التحويلات الخليطة.

إن خصائص الكلمات المسجلة ستكون أحادية الأبعاد (1-D) مما سيكننا تحويلها إلى صيغة ثنائية الإبعاد (2-D).

المرحلة الثانية في التصنيف تتطلب تطبيق التحويلات الخليطة، تحويل فورير ثنائي الأبعاد يطبق على الإشارة ثنائية الأبعاد ثم تحويل رادون ثم تحويل فورير المعكوس أحادي البعد.

بعد ذلك تم استخدام تحويل المويجي المتقطع في النموذج الأول، بينما تم استخدام التحويل الدائري المتعدد في النموذج الثاني.

المرحلة النهائية تتضمن استخدام تحويل الزمن الديناميكي لغرض التمييز بين الكلمات.

أربعون كلمة عربية مسجلة بخمسة عشر زمن مختلف في الأستوديو بواسطة متكلم واحد استخدمت كقاعدة بيانات في هذا العمل.

أداء كل الطرق المستخدمة تم تحليلها و تقييمها بواسطة الحاسوب باستخدام لغة MATLAB (2010a).

إن دقة تمييز الكلام في النموذج الأول تساوي (91 % and 89 %) عندما استعمل التحويل المويجي المتقطع نوع Db4 و Db1 على التوالي بينما كانت الدقة في النموذج الثاني بين (93 %-87 %) عندما استخدمت تسعة أحزمة مختلفة من التحويل الدائري المتعدد.

Abstract EN

Methods of speech recognition have been the subject of several studies over the past decade.

Speech recognition has been one of the most exciting areas of the signal processing.

Mixed transform is a useful tool for speech signal processing ; it is developed for its abilities of improvement in feature extraction.

Speech recognition includes three important stages, preprocessing, feature extraction, and classification.

Recognition accuracy is so affected by the features extraction stage ; therefore different models of mixed transform for feature extraction were proposed.

The properties of the recorded isolated word will be 1-D, which achieve the conversion of each 1-D word into a 2-D form.

The second step of the word recognizer requires, the application of 2-D FFT, Radon transform, the 1-D IFFT, and 1-D discrete wavelet transforms were used in the first proposed model, while discrete multicircularlet transform was used in the second proposed model.

The final stage of the proposed models includes the use of the dynamic time warping algorithm for recognition tasks.

The performance of the proposed systems was evaluated using forty different isolated Arabic words that are recorded fifteen times in a studio for speaker dependent.

The result shows recognition accuracy of (91 % and 89 %) using discrete wavelet transform type Daubechies (Db1) and (Db4) respectively, and the accuracy score between (87 %-93 %) was achieved using discrete multicircularlet transform for 9 sub bands.

American Psychological Association (APA)

Abu al-Lukh, Sadiq Jasim& Abd al-Razzaq, Shahd Mujib. 2013. Isolated word speech recognition using mixed transform. Journal of Engineering،Vol. 19, no. 10, pp.1271-1286.
https://search.emarefa.net/detail/BIM-341613

Modern Language Association (MLA)

Abu al-Lukh, Sadiq Jasim& Abd al-Razzaq, Shahd Mujib. Isolated word speech recognition using mixed transform. Journal of Engineering Vol. 19, no. 10 (Oct. 2013), pp.1271-1286.
https://search.emarefa.net/detail/BIM-341613

American Medical Association (AMA)

Abu al-Lukh, Sadiq Jasim& Abd al-Razzaq, Shahd Mujib. Isolated word speech recognition using mixed transform. Journal of Engineering. 2013. Vol. 19, no. 10, pp.1271-1286.
https://search.emarefa.net/detail/BIM-341613

Data Type

Journal Articles

Language

English

Notes

Includes appendices : p. 1282-1286

Record ID

BIM-341613