An exploratory study of the development of a speech corpus annotated for the main Arabic dialects
العناوين الأخرى
تطوير مدونة لغوية كلامية تتضمن معلومات حول لهجات المتحدثين
المؤلفون المشاركون
المصدر
Arab Journal for the Humanities
العدد
المجلد 38، العدد 150 (30 إبريل/نيسان 2020)، ص ص. 365-386، 22ص.
الناشر
جامعة الكويت مجلس النشر العلمي
تاريخ النشر
2020-04-30
دولة النشر
الكويت
عدد الصفحات
22
التخصصات الرئيسية
الملخص EN
Arabic varieties differ substantially in all aspects of linguistics.
These differences call for dialect specific modeling when building Arabic automatic speech recognition systems.
The paper introduces the development of a multidialect annotated corpus of dialectal Arabic with data obtained from Linguistic Data Consortium (LDC).
The annotation process is applied to GALE (phase 3) broadcast news and broadcast conversational speech.
The annotation process resulted in assigning a dialect label for about 2900 speakers who contributed to this substantial Arabic resource.
The final evaluation of the annotations shows that it achieved a substantial level of agreement.
The annotations are fully available online for searching and downloading along with a set of access tools to help extract specific information from the database.
The researchers’ goal is for this dataset to be used for the development of NLP applications, which pay attention to issues that arise because of the wide range of Arabic accents.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Sharhan, Iman& Ramsay, Allan. 2020. An exploratory study of the development of a speech corpus annotated for the main Arabic dialects. Arab Journal for the Humanities،Vol. 38, no. 150, pp.365-386.
https://search.emarefa.net/detail/BIM-1322780
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
al-Sharhan, Iman& Ramsay, Allan. An exploratory study of the development of a speech corpus annotated for the main Arabic dialects. Arab Journal for the Humanities Vol. 38, no. 150 (Apr. 2020), pp.365-386.
https://search.emarefa.net/detail/BIM-1322780
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Sharhan, Iman& Ramsay, Allan. An exploratory study of the development of a speech corpus annotated for the main Arabic dialects. Arab Journal for the Humanities. 2020. Vol. 38, no. 150, pp.365-386.
https://search.emarefa.net/detail/BIM-1322780
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
رقم السجل
BIM-1322780
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر