نظام ذكائي للتعرف على لغات متعددة

Other Title(s)

Intelligence system for multi-language recognition

Joint Authors

الحمداني، محمد نايف
رمو، فوزية محمود

Source

التربية و العلم : مجلة علمية للبحوث العلمية الأساسية

Issue

Vol. 31, Issue 1 (31 Mar. 2022), pp.93-110, 18 p.

Publisher

University of Mosul College of Education for Pure Science

Publication Date

2022-03-31

Country of Publication

Iraq

No. of Pages

18

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

تستعمل أنظمة تصنيف اللغة لتصنيف اللغة المنطوقة من عينة صوتية معينة وهي عادة الخطوة الأولى للعديد من مهام معالجة اللغة المنطوقة، مثل أنظمة التعرف التلقائي على الكلام ومن دون الاكتشاف التلقائي للغة لا يمكن تحليل الكلام المنطوق بشكل صحيح ولا يمكن تطبيق القواعد النحوية، مما يتسبب في فشل خطوات التعرف على الكلام اللاحقة.

نقترح نظام تصنيف اللغة الذي يحل المشكلة في مجال الصورة، بدلا من مجال الصوت.

حدد هذا البحث ونفذ العديد من الميزات منخفضة المستوى باستخدام معاملات درجة النغم (Mel Frequency Cepstral Coefficients)، والتي تستخلص الصفات من ملفات الكلام لأربع لغات (العربية، الإنجليزية الفرنسية الكردية) من قاعدة البيانات (M2L_Dataset) هي مصدر البيانات المستخدمة في هذا البحث.

تستخدم الشبكة العصبية الالتفافية (Convolutional Neuron Network) بحيث تعمل على صور المخطط الطيفي للمقتطفات الصوتية المتوفرة.

أظهرنا في تجارب مكثفة أن نموذجنا قابل للتطبيق على مجموعة من السيناريوهات الصاخبة ويمكن بسهولة توسيعه ليشمل لغات غير معروفة سابقا، مع الحفاظ على دقة التصنيف.

أصدرنا الكود الخاص بنا ومجموعة تدريب واسعة النطاق الأنظمة تصنيف اللغة للمجتمع.

تم تطبيق خوارزمية الشبكات العصبية الالتفافية (CNN) في هذا البحث للتصنيف وكانت النتيجة مثالية، إذ بلغت دقة التصنيف 97% بين لغتين إذا كان طول العينة ثانية واحدة فقط، أما إذا كان طول العينة ثانيتين فقد بلغت دقة التصنيف 98%.

في حين التصنيف بين ثلاث لغات فقد بلغت دقة التصنيف 95% إذا كان طول العينة ثانية واحدة فقط، أما إذا كان طول العينة ثانيتين فقد بلغت دقة التصنيف 96%.

Abstract EN

Language classification systems are used to classify spoken language from a particular phoneme sample and are usually the first step of many spoken language processing tasks, such as automatic speech recognition (ASR) systems without automatic language detection, spoken speech cannot be properly analyzed and grammar rules cannot be applied, causing failures subsequent speech recognition steps.

we propose a language classification system that solves the problem in the image field, rather than the sound field.

this research identified and implemented several low-level features using MEL frequency cepstral coefficients, which extract traits from speech files of four languages (Arabic, English, French, Kurdish) from the database (m2l_dataset) as the data source used in this research.

a convolutional neuron network is used to operate on spectrogram images of the available audio snippets.

in extensive experiments, we showed that our model is applicable to a range of noisy scenarios and can easily be extended to previously unknown languages, while maintaining classification accuracy.

we released our own code and extensive training package for language classification systems for the community.

CNN algorithm was applied in this research to classify and the result was perfect, as the classification accuracy reached 97% between two languages if the sample length was only one second, but if the sample length was two seconds, the classification accuracy reached 98%.

while the classification among three languages, the classification accuracy reached 95% if the sample length was only one second, but if the sample length was two seconds, the classification accuracy reached 96%.

American Psychological Association (APA)

رمو، فوزية محمود والحمداني، محمد نايف. 2022. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 31، ع. 1، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052

Modern Language Association (MLA)

رمو، فوزية محمود والحمداني، محمد نايف. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 31، ع. 1 (2022)، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052

American Medical Association (AMA)

رمو، فوزية محمود والحمداني، محمد نايف. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2022. مج. 31، ع. 1، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052

Data Type

Journal Articles

Language

Arabic

Notes

يتضمن مراجع ببليوجرافية: ص. 110

Record ID

BIM-1343052