Automatic spoken Qur’anic phonemes classification

العناوين الأخرى

التعرف الآلي على الألفاظ القرآنية المنطوقة

مقدم أطروحة جامعية

Khalil, Iyas Anwar al-Shaykh

مشرف أطروحة جامعية

al-Hanjuri, Muhammad Ahmad Muhammad

الجامعة

الجامعة الإسلامية

الكلية

كلية تكنولوجيا المعلومات

القسم الأكاديمي

تكنولوجيا المعلومات

دولة الجامعة

فلسطين (قطاع غزة)

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2018

الملخص العربي

كل المسلمين بحاجة لتعلم القراءة الصحيحة للقرآن الكريم.

العرب في هذه الأيام يتحدثون بلهجاتهم المحلية، و القرآن الكريم لا تصح قراءته إلا بالعربية الفصحى و لذلك يواجه العرب صعوبات في تعلم قراءة القرآن الكريم بشكل صحيح، و هذه المشكلة تتضاعف بالنسبة لغير العرب.

بالإضافة إلى الحاجة الكبيرة للتعلم، فإن طرق التعليم التقليدية للقرآن الكريم تحتاج جهدا كبيرا.

فبناءا على هذه الطرق، يلزم المدرس بتعليم طالب واحد بشكل فردي.

الحل الأمثل لهذه المشكلة هو نظام تعليم بمساعدة الحاسوب نحتاج فيه لاستخدام تقنيات .ASR يكون هذا النظام قادرا على التعرف على التلاوات القرآنية، بالإضافة إلى إمكانية اكتشاف أخطاء التلاوة.

النظام لابد أن يكون قابلا للتوسعة بحيث يصبح قادرا على التعرف على كل سور القرآن الكريم، كما أنه لابد أن يكون لديه المعرفة بأحكام التجويد.

النظام الذي اقترحناه هو نظام يتكون من مستويين.

نظام ASR مخصص للتعرف على مستوى الفونيمات.

و متعرفات HMM خاصة للتعرف على مستوى الألوفونات.

قمنا بمقارنة طريقتين من طرق استخراج مميزات الصوت و هما MFCC و طريقة أخرى تجمع بين DWT و MFCC بناءا على النتائج الأولية التي حصلنا عليها، قمنا بإضافة تعديلات على نظام ASR ليصبح قادرا على التعرف على الألوفونات أيضا.

لعملية التعليم و الفحص تم جمع بيانات بشكل خاص لهذا العمل.

قمنا بإجراء تجرتبين، واحدة لفحص نظام ASR المقترح، و الأخرى لفحص نفس النظام بعد التعديل التجربة الأولى أظهرت نتائج جيدة في عملية التعرف على التلاوة، و قد حققت نسبة تعرف 98.20% .

لكن النظام فشل في اكتشاف أخطاء التلاوة و التجويد، فقد حقق نسبة صحيح %60.94 فقط.

في التجربة الثانية التعرف على التلاوة حقق 98.35%.

بينما نتائج اكتشاف الأخطاء أظهرت تحسنا كبيرا، فقد وصلت نسبة الاكتشاف الصحيح إلى 86.61 في المستوى الثاني قمنا بتعليم متعرف خاص واحد للتعرف على همس الكاف.

و هذا بسبب النتائج السيئة التي حققها نظام ASR في التعرف عليه.

عملية التعرف الآلي باستخدام طريقة MFCC حققت نسبة 85.71%.

بينما طريقة MFDWC فقد حققت تحسنا بنسبة 7.15%.

النتائج التي حصلنا عليها مبشرة و النظام الذي اقترحناه أثبت نجاحه في تحقيق أهداف الرسالة.

لكن نظام التعرف الآلي على الصوت أظهر عجزا في التعرف على الفونيمات ذات المدة الطويلة.

الملخص الإنجليزي

All Muslims have to learn the correct recitation of the Holy Quran.

Arabs nowadays speak Arabic in the local dialects, and the Holy Quran must be recited in classical Arabic.

So they face difficulties to recite the Holy Quran correctly.

This problem is doubled for non-Arabs.

In addition to the great need for learning, the traditional teaching methods are strenuous.

Computer aided learning system is an efficient solution for the previous problem.

Automatic Speech Recognition (ASR) techniques are widely used for this purpose.

An ASR system that can recognize the recitations of the Holy Quran, and can detect recitation mistakes, ASR system with these properties is necessary to meet our solution aims.

The system have to be able to be extended for the all Holy Quran chapters, and have the necessary knowledge about the recitation rules ‘Tajweed rules’.

A system of two levels is proposed.

An ASR system to recognize the phonemes level, and special Hidden Markov Models (HMM) recognizers for the allophones level.

The efficiency of two feature extraction techniques are compared, the Mel-Frequency Cepstrum Coefficients (MFCC) and a technique that combine Multi-Resolution Discrete Wavelet Transform (DWT) and MFCC called (MFDWC).

A modification in the ASR system is added to be able to recognize allophones, this is due to the preliminary results obtained.

For training and testing especial datasets are created.

Two tests are conducted, one for the proposed ASR system and the other for the modified system.

The first test shows good results in recitation recognition, it reaches 98.20%, but the system fails in Tajweed rules checking, it reaches just 60.94% correct detection.

At the second test the recognition rate reaches 98.35%, while the detection of Tajweed rules is improved significantly, it reaches 86.61%.

In the second level, just one special recognizer is trained for the Kaaf Whisper.

This is due to the bad ASR detection results on it.

The detection ratio of using MFCC feature extraction technique is 85.71%.

The usage of the MFDWC technique improves the detection ratio with 7.15%.

The results are optimistic, and the proposed system proved to be an acceptable solution for the mentioned problem.

The ASR system has a limitation in detection the phonemes that have long durations.

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

عدد الصفحات

53

قائمة المحتويات

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Tajweed rules phonology.

Chapter Three : Theoretical background.

Chapter Four : Methodology.

Chapter Five : Result and evaluation.

Chapter Six : Conclusion.

References.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Khalil, Iyas Anwar al-Shaykh. (2018). Automatic spoken Qur’anic phonemes classification. (Master's theses Theses and Dissertations Master). Islamic University, Palestine (Gaza Strip)
https://search.emarefa.net/detail/BIM-905428

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Khalil, Iyas Anwar al-Shaykh. Automatic spoken Qur’anic phonemes classification. (Master's theses Theses and Dissertations Master). Islamic University. (2018).
https://search.emarefa.net/detail/BIM-905428

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Khalil, Iyas Anwar al-Shaykh. (2018). Automatic spoken Qur’anic phonemes classification. (Master's theses Theses and Dissertations Master). Islamic University, Palestine (Gaza Strip)
https://search.emarefa.net/detail/BIM-905428

لغة النص

الإنجليزية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-905428