نظام تحديد المتحدث المعتمد على النص بالاعتماد على التعلم العميق

العناوين الأخرى

Text dependent speaker identification system based on deep learnin

المؤلفون المشاركون

يسرى فيصل الرحيم
قاسم صديق محمود

المصدر

التربية و العلم : مجلة علمية للبحوث العلمية الأساسية

العدد

المجلد 30، العدد 4 (30 سبتمبر/أيلول 2021)، ص ص. 141-160، 20ص.

الناشر

جامعة الموصل كلية التربية للعلوم الصرفة

تاريخ النشر

2021-09-30

دولة النشر

العراق

عدد الصفحات

20

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

تعد تقنيات التعرف على المتحدث من أهم التقنيات الحديثة و قد تم تطوير العديد من الأنظمة المختلفة من حيث الطرق المستخدمة في استخراج الخصائص و طرق التصنيف.

تشكل ان تطبيقات التعرف على المتحدث تحديا كبيرا، حيث يتطلب تقنيات حديثة و عدد كبير من عينات الصوتية و موارد كبيرة.

في هذه البحث تم تصميم نظام لتحديد هويه المتحدث المعتمد على النص (تكون الكلمة أو الجمل محددة مسبقا) حيث يتميز النظام بقدرته على التعرف على المتحدث باقل وقت و أقل عدد من عينات التدريب و أقل الموارد.

يتكون النظام من أربعة أجزاء رئيسية و هي : الجزء الأول بناء قواعد بيانات صوتية، تم الاعتماد في الدراسة على قاعدتين للبيانات الصوتية، الأولى قاعدة بيانات (QS- Dataset) و قاعدة البيانات الثانية (audioMNIST_meta)، و قد تم معالجة و تهيئة قواعد البيانات بطريقة تم شرحها في متن البحث لاحقا.

الجزء الثاني من البحث استخلاص الخصائص عن طريق خوارزمية معاملات درجة النغم أما الجزء الثالث فهو استخدام الشبكة العصبية كمصنف.

و أما الجزء الأخير في البحث فهو التحقق من عمل و نتائج النظام.

أوضحت نتائج الاختبار قدرة شبكة MNN على التعامل مع أقل عدد من البيانات حيث حققت نسبة (100%) و أما مع البيانات الكبيرة تتراوح من 80% الى 81% على عكس شبكة CNN كانت نتائج غير جيدة بالنسبة للبيانات القليلة من60% الى 76 % و مع بيانات الكبيرة كانت النتائج ممتازة من 91% الى 96 %

الملخص EN

Speaker identification techniques are one of those most advanced modern technologies and there are many different systems had been developed, from methods that used to extract characteristics and classification.

The applications of Speech identification are quite difficult and requires modern technologies with a large number of audio samples and resources.

In this research, the system of speaker identification had been designed based on a text (the word or sentences are pre-defined) which give the system the capability to identify the speaker in the least time, number of training samples and resources.

The system consists four main parts, the first one is to create audio databases.

In the study, two audio databases were relied upon, the first being a database (QS- Dataset) and the second database (audioMNIST_meta).

The databases were processed and configured in a way that was explained in the body of the research later.

The second part of the research is to extract the characteristics through the pitch coefficients algorithm, while the third part is the use of the neural network as a classifier.

And the last part of the research is to verify the work and results of the system.

The test results showed the ability of the MNN network to deal with the smallest number of data, as it achieved a percentage of 100%.

As for large data, it ranged from 80% to 81%.

Unlike CNN network, the results were not good for the few data, from 60% to 76%, and with large data it was The results are excellent, from 91% to 96%.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

يسرى فيصل الرحيم وقاسم صديق محمود. 2021. نظام تحديد المتحدث المعتمد على النص بالاعتماد على التعلم العميق. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 30، ع. 4، ص ص. 141-160.
https://search.emarefa.net/detail/BIM-1282584

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

يسرى فيصل الرحيم وقاسم صديق محمود. نظام تحديد المتحدث المعتمد على النص بالاعتماد على التعلم العميق. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 30، ع. 4 (2021)، ص ص. 141-160.
https://search.emarefa.net/detail/BIM-1282584

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

يسرى فيصل الرحيم وقاسم صديق محمود. نظام تحديد المتحدث المعتمد على النص بالاعتماد على التعلم العميق. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2021. مج. 30، ع. 4، ص ص. 141-160.
https://search.emarefa.net/detail/BIM-1282584

نوع البيانات

مقالات

لغة النص

العربية

الملاحظات

يتضمن مراجع ببليوجرافية : ص. 159-160

رقم السجل

BIM-1282584