Voice identification using MFCC and vector quantization
Other Title(s)
التعرف على الصوت باستخدام MFCC و Vector Quantization
Joint Authors
al-Khatib, Basil
Kamal al-Din, Muhammad Madyan
Source
Issue
Vol. 17, Issue 3 (sup) (30 Sep. 2020), pp.1019-1028, 10 p.
Publisher
University of Baghdad College of Science for Women
Publication Date
2020-09-30
Country of Publication
Iraq
No. of Pages
10
Main Subjects
Information Technology and Computer Science
Topics
- Artificial intelligence
- Speech processing systems
- Signal processing
- Security measures
- Phonological awareness
Abstract AR
يعد التعرف على المتحدث أحد المشكلات الأساسية في معالجة الكلام و نمذجة الصوت.
تتضمن تطبيقات التعرف على المتحدث المصادقة في أنظمة الأمان و دقة الاختيار.
تشكل تطبيقات التعرف على الصوت تحديا كبيرا على نطاق واسع حيث يتطلب البحث السريع في قاعدة بيانات الاصوات تقنيات حديثة سريعة و تعتمد على الذكاء الاصطناعي لتحقيق النتائج المرجوة من النظام.
تم بذل العديد من الجهود لتحقيق ذلك من خلال إنشاء أنظمة قائمة على المتغيرات و تطوير منهجيات جديدة لتحديد المتحدثين.
التعرف على المتحدث هو عملية التعرف على من يتحدث باستخدام الخصائص المستخرجة من موجات الكلام الخاصة به مثل درجة الصوت و النغمة و التردد و يتم إنشاء نماذج المتكلم و حفظها في بيئة النظام و تستخدم لاحقا للتحقق من الهوية المطلوبة من قبل الأشخاص الذين يصلون إلى النظام، و الذي يسمح بالوصول إلى الخدمات المختلفة التي يتم التحكم بها عن طريق الصوت، و يشمل تحديد المتحدث جزأين رئيسيين : الجزء الأول هو استخراج الميزات الصوتية أما الجزء الثاني فهو مطابقة و مقارنة هذه الميزات.
Abstract EN
The speaker identification is one of the fundamental problems in speech processing and voice modeling.
The speaker identification applications include authentication in critical security systems and the accuracy of the selection.
Large-scale voice recognition applications are a major challenge.
Quick search in the speaker database requires fast, modern techniques and relies on artificial intelligence to achieve the desired results from the system.
Many efforts are made to achieve this through the establishment of variable-based systems and the development of new methodologies for speaker identification.
Speaker identification is the process of recognizing who is speaking using the characteristics extracted from the speech's waves like pitch, tone, and frequency.
The speaker's models are created and saved in the system environment and used to verify the identity required by people accessing the systems, which allows access to various services that are controlled by voice, speaker identification involves two main parts: the first part is the feature extraction and the second part is the feature matching.
American Psychological Association (APA)
al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. 2020. Voice identification using MFCC and vector quantization. Baghdad Science Journal،Vol. 17, no. 3 (sup), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728
Modern Language Association (MLA)
al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. Voice identification using MFCC and vector quantization. Baghdad Science Journal Vol. 17, no. 3 (Supplement) (Sep. 2020), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728
American Medical Association (AMA)
al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. Voice identification using MFCC and vector quantization. Baghdad Science Journal. 2020. Vol. 17, no. 3 (sup), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728
Data Type
Journal Articles
Language
English
Notes
Text in English ; abstracts in English and Arabic.
Record ID
BIM-976728