نظام ذكائي للتعرف على لغات متعددة
Other Title(s)
Intelligence system for multi-language recognition
Joint Authors
الحمداني، محمد نايف
رمو، فوزية محمود
Source
التربية و العلم : مجلة علمية للبحوث العلمية الأساسية
Issue
Vol. 31, Issue 1 (31 Mar. 2022), pp.93-110, 18 p.
Publisher
University of Mosul College of Education for Pure Science
Publication Date
2022-03-31
Country of Publication
Iraq
No. of Pages
18
Main Subjects
Information Technology and Computer Science
Topics
- Artificial intelligence
- Computational linguistics
- Languages
- Neural networks(Computer science)
- Deep learning
Abstract AR
تستعمل أنظمة تصنيف اللغة لتصنيف اللغة المنطوقة من عينة صوتية معينة وهي عادة الخطوة الأولى للعديد من مهام معالجة اللغة المنطوقة، مثل أنظمة التعرف التلقائي على الكلام ومن دون الاكتشاف التلقائي للغة لا يمكن تحليل الكلام المنطوق بشكل صحيح ولا يمكن تطبيق القواعد النحوية، مما يتسبب في فشل خطوات التعرف على الكلام اللاحقة.
نقترح نظام تصنيف اللغة الذي يحل المشكلة في مجال الصورة، بدلا من مجال الصوت.
حدد هذا البحث ونفذ العديد من الميزات منخفضة المستوى باستخدام معاملات درجة النغم (Mel Frequency Cepstral Coefficients)، والتي تستخلص الصفات من ملفات الكلام لأربع لغات (العربية، الإنجليزية الفرنسية الكردية) من قاعدة البيانات (M2L_Dataset) هي مصدر البيانات المستخدمة في هذا البحث.
تستخدم الشبكة العصبية الالتفافية (Convolutional Neuron Network) بحيث تعمل على صور المخطط الطيفي للمقتطفات الصوتية المتوفرة.
أظهرنا في تجارب مكثفة أن نموذجنا قابل للتطبيق على مجموعة من السيناريوهات الصاخبة ويمكن بسهولة توسيعه ليشمل لغات غير معروفة سابقا، مع الحفاظ على دقة التصنيف.
أصدرنا الكود الخاص بنا ومجموعة تدريب واسعة النطاق الأنظمة تصنيف اللغة للمجتمع.
تم تطبيق خوارزمية الشبكات العصبية الالتفافية (CNN) في هذا البحث للتصنيف وكانت النتيجة مثالية، إذ بلغت دقة التصنيف 97% بين لغتين إذا كان طول العينة ثانية واحدة فقط، أما إذا كان طول العينة ثانيتين فقد بلغت دقة التصنيف 98%.
في حين التصنيف بين ثلاث لغات فقد بلغت دقة التصنيف 95% إذا كان طول العينة ثانية واحدة فقط، أما إذا كان طول العينة ثانيتين فقد بلغت دقة التصنيف 96%.
Abstract EN
Language classification systems are used to classify spoken language from a particular phoneme sample and are usually the first step of many spoken language processing tasks, such as automatic speech recognition (ASR) systems without automatic language detection, spoken speech cannot be properly analyzed and grammar rules cannot be applied, causing failures subsequent speech recognition steps.
we propose a language classification system that solves the problem in the image field, rather than the sound field.
this research identified and implemented several low-level features using MEL frequency cepstral coefficients, which extract traits from speech files of four languages (Arabic, English, French, Kurdish) from the database (m2l_dataset) as the data source used in this research.
a convolutional neuron network is used to operate on spectrogram images of the available audio snippets.
in extensive experiments, we showed that our model is applicable to a range of noisy scenarios and can easily be extended to previously unknown languages, while maintaining classification accuracy.
we released our own code and extensive training package for language classification systems for the community.
CNN algorithm was applied in this research to classify and the result was perfect, as the classification accuracy reached 97% between two languages if the sample length was only one second, but if the sample length was two seconds, the classification accuracy reached 98%.
while the classification among three languages, the classification accuracy reached 95% if the sample length was only one second, but if the sample length was two seconds, the classification accuracy reached 96%.
American Psychological Association (APA)
رمو، فوزية محمود والحمداني، محمد نايف. 2022. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية،مج. 31، ع. 1، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052
Modern Language Association (MLA)
رمو، فوزية محمود والحمداني، محمد نايف. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية مج. 31، ع. 1 (2022)، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052
American Medical Association (AMA)
رمو، فوزية محمود والحمداني، محمد نايف. نظام ذكائي للتعرف على لغات متعددة. التربية و العلم : مجلة علمية للبحوث العلمية الأساسية. 2022. مج. 31، ع. 1، ص ص. 93-110.
https://search.emarefa.net/detail/BIM-1343052
Data Type
Journal Articles
Language
Arabic
Notes
يتضمن مراجع ببليوجرافية: ص. 110
Record ID
BIM-1343052