نظام ذكائي للتعرف على لغات متعددة

العناوين الأخرى

Intelligence system for multi-language recognition

المؤلفون المشاركون

الحمداني، محمد نايف
رمو، فوزية محمود

المصدر

التربية و العلم : مجلة علمية للبحوث العلمية الأساسية

العدد

المجلد 31، العدد 1 (31 مارس/آذار 2022)، ص ص. 93-110، 18ص.

الناشر

جامعة الموصل كلية التربية للعلوم الصرفة

تاريخ النشر

2022-03-31

دولة النشر

العراق

عدد الصفحات

18

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

تستعمل أنظمة تصنيف اللغة لتصنيف اللغة المنطوقة من عينة صوتية معينة وهي عادة الخطوة الأولى للعديد من مهام معالجة اللغة المنطوقة، مثل أنظمة التعرف التلقائي على الكلام ومن دون الاكتشاف التلقائي للغة لا يمكن تحليل الكلام المنطوق بشكل صحيح ولا يمكن تطبيق القواعد النحوية، مما يتسبب في فشل خطوات التعرف على الكلام اللاحقة.

نقترح نظام تصنيف اللغة الذي يحل المشكلة في مجال الصورة، بدلا من مجال الصوت.

حدد هذا البحث ونفذ العديد من الميزات منخفضة المستوى باستخدام معاملات درجة النغم (Mel Frequency Cepstral Coefficients)، والتي تستخلص الصفات من ملفات الكلام لأربع لغات (العربية، الإنجليزية الفرنسية الكردية) من قاعدة البيانات (M2L_Dataset) هي مصدر البيانات المستخدمة في هذا البحث.

تستخدم الشبكة العصبية الالتفافية (Convolutional Neuron Network) بحيث تعمل على صور المخطط الطيفي للمقتطفات الصوتية المتوفرة.

أظهرنا في تجارب مكثفة أن نموذجنا قابل للتطبيق على مجموعة من السيناريوهات الصاخبة ويمكن بسهولة توسيعه ليشمل لغات غير معروفة سابقا، مع الحفاظ على دقة التصنيف.

أصدرنا الكود الخاص بنا ومجموعة تدريب واسعة النطاق الأنظمة تصنيف اللغة للمجتمع.

تم تطبيق خوارزمية الشبكات العصبية الالتفافية (CNN) في هذا البحث للتصنيف وكانت النتيجة مثالية، إذ بلغت دقة التصنيف 97% بين لغتين إذا كان طول العينة ثانية واحدة فقط، أما إذا كان طول العينة ثانيتين فقد بلغت دقة التصنيف 98%.

في حين التصنيف بين ثلاث لغات فقد بلغت دقة التصنيف 95% إذا كان طول العينة ثانية واحدة فقط، أما إذا كان طول العينة ثانيتين فقد بلغت دقة التصنيف 96%.

الملخص EN

Language classification systems are used to classify spoken language from a particular phoneme sample and are usually the first step of many spoken language processing tasks, such as automatic speech recognition (ASR) systems without automatic language detection, spoken speech cannot be properly analyzed and grammar rules cannot be applied, causing failures subsequent speech recognition steps.

we propose a language classification system that solves the problem in the image field, rather than the sound field.

this research identified and implemented several low-level features using MEL frequency cepstral coefficients, which extract traits from speech files of four languages (Arabic, English, French, Kurdish) from the database (m2l_dataset) as the data source used in this research.

a convolutional neuron network is used to operate on spectrogram images of the available audio snippets.

in extensive experiments, we showed that our model is applicable to a range of noisy scenarios and can easily be extended to previously unknown languages, while maintaining classification accuracy.

we released our own code and extensive training package for language classification systems for the community.

CNN algorithm was applied in this research to classify and the result was perfect, as the classification accuracy reached 97% between two languages if the sample length was only one second, but if the sample length was two seconds, the classification accuracy reached 98%.

while the classification among three languages, the classification accuracy reached 95% if the sample length was only one second, but if the sample length was two seconds, the classification accuracy reached 96%.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

رمو، فوزية محمود والحمداني، محمد نايف. 2022. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 31، ع. 1، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

رمو، فوزية محمود والحمداني، محمد نايف. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 31، ع. 1 (2022)، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

رمو، فوزية محمود والحمداني، محمد نايف. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2022. مج. 31، ع. 1، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052

نوع البيانات

مقالات

لغة النص

العربية

الملاحظات

يتضمن مراجع ببليوجرافية: ص. 110

رقم السجل

BIM-1343052