Voice identification using MFCC and vector quantization

Other Title(s)

التعرف على الصوت باستخدام MFCC و Vector Quantization

Joint Authors

al-Khatib, Basil
Kamal al-Din, Muhammad Madyan

Source

Baghdad Science Journal

Issue

Vol. 17, Issue 3 (sup) (30 Sep. 2020), pp.1019-1028, 10 p.

Publisher

University of Baghdad College of Science for Women

Publication Date

2020-09-30

Country of Publication

Iraq

No. of Pages

10

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

يعد التعرف على المتحدث أحد المشكلات الأساسية في معالجة الكلام و نمذجة الصوت.

تتضمن تطبيقات التعرف على المتحدث المصادقة في أنظمة الأمان و دقة الاختيار.

تشكل تطبيقات التعرف على الصوت تحديا كبيرا على نطاق واسع حيث يتطلب البحث السريع في قاعدة بيانات الاصوات تقنيات حديثة سريعة و تعتمد على الذكاء الاصطناعي لتحقيق النتائج المرجوة من النظام.

تم بذل العديد من الجهود لتحقيق ذلك من خلال إنشاء أنظمة قائمة على المتغيرات و تطوير منهجيات جديدة لتحديد المتحدثين.

التعرف على المتحدث هو عملية التعرف على من يتحدث باستخدام الخصائص المستخرجة من موجات الكلام الخاصة به مثل درجة الصوت و النغمة و التردد و يتم إنشاء نماذج المتكلم و حفظها في بيئة النظام و تستخدم لاحقا للتحقق من الهوية المطلوبة من قبل الأشخاص الذين يصلون إلى النظام، و الذي يسمح بالوصول إلى الخدمات المختلفة التي يتم التحكم بها عن طريق الصوت، و يشمل تحديد المتحدث جزأين رئيسيين : الجزء الأول هو استخراج الميزات الصوتية أما الجزء الثاني فهو مطابقة و مقارنة هذه الميزات.

Abstract EN

The speaker identification is one of the fundamental problems in speech processing and voice modeling.

The speaker identification applications include authentication in critical security systems and the accuracy of the selection.

Large-scale voice recognition applications are a major challenge.

Quick search in the speaker database requires fast, modern techniques and relies on artificial intelligence to achieve the desired results from the system.

Many efforts are made to achieve this through the establishment of variable-based systems and the development of new methodologies for speaker identification.

Speaker identification is the process of recognizing who is speaking using the characteristics extracted from the speech's waves like pitch, tone, and frequency.

The speaker's models are created and saved in the system environment and used to verify the identity required by people accessing the systems, which allows access to various services that are controlled by voice, speaker identification involves two main parts: the first part is the feature extraction and the second part is the feature matching.

American Psychological Association (APA)

al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. 2020. Voice identification using MFCC and vector quantization. Baghdad Science Journal،Vol. 17, no. 3 (sup), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728

Modern Language Association (MLA)

al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. Voice identification using MFCC and vector quantization. Baghdad Science Journal Vol. 17, no. 3 (Supplement) (Sep. 2020), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728

American Medical Association (AMA)

al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. Voice identification using MFCC and vector quantization. Baghdad Science Journal. 2020. Vol. 17, no. 3 (sup), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728

Data Type

Journal Articles

Language

English

Notes

Text in English ; abstracts in English and Arabic.

Record ID

BIM-976728