Voice identification using MFCC and vector quantization

العناوين الأخرى

التعرف على الصوت باستخدام MFCC و Vector Quantization

المؤلفون المشاركون

al-Khatib, Basil
Kamal al-Din, Muhammad Madyan

المصدر

Baghdad Science Journal

العدد

المجلد 17، العدد 3 (sup) (30 سبتمبر/أيلول 2020)، ص ص. 1019-1028، 10ص.

الناشر

جامعة بغداد كلية العلوم للبنات

تاريخ النشر

2020-09-30

دولة النشر

العراق

عدد الصفحات

10

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

يعد التعرف على المتحدث أحد المشكلات الأساسية في معالجة الكلام و نمذجة الصوت.

تتضمن تطبيقات التعرف على المتحدث المصادقة في أنظمة الأمان و دقة الاختيار.

تشكل تطبيقات التعرف على الصوت تحديا كبيرا على نطاق واسع حيث يتطلب البحث السريع في قاعدة بيانات الاصوات تقنيات حديثة سريعة و تعتمد على الذكاء الاصطناعي لتحقيق النتائج المرجوة من النظام.

تم بذل العديد من الجهود لتحقيق ذلك من خلال إنشاء أنظمة قائمة على المتغيرات و تطوير منهجيات جديدة لتحديد المتحدثين.

التعرف على المتحدث هو عملية التعرف على من يتحدث باستخدام الخصائص المستخرجة من موجات الكلام الخاصة به مثل درجة الصوت و النغمة و التردد و يتم إنشاء نماذج المتكلم و حفظها في بيئة النظام و تستخدم لاحقا للتحقق من الهوية المطلوبة من قبل الأشخاص الذين يصلون إلى النظام، و الذي يسمح بالوصول إلى الخدمات المختلفة التي يتم التحكم بها عن طريق الصوت، و يشمل تحديد المتحدث جزأين رئيسيين : الجزء الأول هو استخراج الميزات الصوتية أما الجزء الثاني فهو مطابقة و مقارنة هذه الميزات.

الملخص EN

The speaker identification is one of the fundamental problems in speech processing and voice modeling.

The speaker identification applications include authentication in critical security systems and the accuracy of the selection.

Large-scale voice recognition applications are a major challenge.

Quick search in the speaker database requires fast, modern techniques and relies on artificial intelligence to achieve the desired results from the system.

Many efforts are made to achieve this through the establishment of variable-based systems and the development of new methodologies for speaker identification.

Speaker identification is the process of recognizing who is speaking using the characteristics extracted from the speech's waves like pitch, tone, and frequency.

The speaker's models are created and saved in the system environment and used to verify the identity required by people accessing the systems, which allows access to various services that are controlled by voice, speaker identification involves two main parts: the first part is the feature extraction and the second part is the feature matching.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. 2020. Voice identification using MFCC and vector quantization. Baghdad Science Journal،Vol. 17, no. 3 (sup), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. Voice identification using MFCC and vector quantization. Baghdad Science Journal Vol. 17, no. 3 (Supplement) (Sep. 2020), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

al-Khatib, Basil& Kamal al-Din, Muhammad Madyan. Voice identification using MFCC and vector quantization. Baghdad Science Journal. 2020. Vol. 17, no. 3 (sup), pp.1019-1028.
https://search.emarefa.net/detail/BIM-976728

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Text in English ; abstracts in English and Arabic.

رقم السجل

BIM-976728