Parallel HMM-based approach for Arabic part of speech tagging
المؤلفون المشاركون
Kazim, Ayyub
Lazrek, Izz al-Din
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 15، العدد 2 (31 مارس/آذار 2018)، ص ص. 341-351، 11ص.
الناشر
تاريخ النشر
2018-03-31
دولة النشر
الأردن
عدد الصفحات
11
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
In this paper we try to go beyond the classical use of the Hidden Markov Model for Part Of Speech Tagging, particularly for the Arabic language.
In fact, most available Arabic tagging systems and tagsets are derived from English and do not make use of the linguistic richness of Arabic.
Our new proposed tagging system will consist of two Hidden Markov Models working in parallel: In addition to the main model, a second model is added to serve as a reference for low probabilities tags.
Of course, a dual corpus is required to train both models.
To do so, we restructure the Nemlar Arabic corpus and extract a new tagset from diacritics and grammatical rules.
The approach is implemented by using Java programming environment and several experimentations are conducted to evaluate it.
The results of this approach, which are promising, as well as its limitations, are deeply discussed and future possible enhancements are also highlighted.
This work will open the door for new promising research perspectives, particularly for the Arabic language processing, and more generally for the applications of Hidden Markov Models
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Kazim, Ayyub& Lazrek, Izz al-Din. 2018. Parallel HMM-based approach for Arabic part of speech tagging. The International Arab Journal of Information Technology،Vol. 15, no. 2, pp.341-351.
https://search.emarefa.net/detail/BIM-838601
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Kazim, Ayyub& Lazrek, Izz al-Din. Parallel HMM-based approach for Arabic part of speech tagging. The International Arab Journal of Information Technology Vol. 15, no. 2 (Mar. 2018), pp.341-351.
https://search.emarefa.net/detail/BIM-838601
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Kazim, Ayyub& Lazrek, Izz al-Din. Parallel HMM-based approach for Arabic part of speech tagging. The International Arab Journal of Information Technology. 2018. Vol. 15, no. 2, pp.341-351.
https://search.emarefa.net/detail/BIM-838601
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes appendix : p. 351
رقم السجل
BIM-838601
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر