Prototype for a standard Arabic sentiment : analysis corpus
المؤلفون المشاركون
al-Ayyub, Mahmud
Wahshih, Haydar
al-Smadi, Izzat
al-Kabi, Muhammad
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 13، العدد 1A(s) (31 ديسمبر/كانون الأول 2016)، ص ص. 163-170، 8ص.
الناشر
تاريخ النشر
2016-12-31
دولة النشر
الأردن
عدد الصفحات
8
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
The researchers in the field of Arabic Sentiment Analysis (SA) need a relatively big standard corpus to conduct their studies.
There are a number of existing datasets; however, they suffer from certain limitations such as the small number of reviews or topics they contain, the restriction to Modern Standard Arabic (MSA), etc., Moreover, most of them are in-house datasets that are not publicly available.
Therefore, this study aims to establish a flexible and relatively big standard Arabic SA corpus that can be considered as a foundation to build larger Arabic corpora.
In addition to MSA, this corpus contains reviews written in the five main Arabic dialects (Egyptian, Levantine, Arabian Peninsula, Mesopotamian, and Maghrebi group).
Furthermore, this corpus has other five types of reviews (English, mixed MSA English, French, mixed MSA and Emoticons, and mixed Egyptian and Emoticons).
This corpus is released for free to be used by researchers in this field, where it is characterized by its flexibility in allowing the users to add, remove, and revise its contents.
The total number of topics and reviews of this initial version are 250 and 1,442, respectively.
The collected topics are distributed equally among five domains (classes): Economy, Food-Life style, Religion, Sport, and Technology, where each domain has 50 topics.
This corpus is built manually to ensure the highest quality to the researchers in this field
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Kabi, Muhammad& al-Ayyub, Mahmud& al-Smadi, Izzat& Wahshih, Haydar. 2016. Prototype for a standard Arabic sentiment : analysis corpus. The International Arab Journal of Information Technology،Vol. 13, no. 1A(s), pp.163-170.
https://search.emarefa.net/detail/BIM-758307
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
al-Kabi, Muhammad…[et al.]. Prototype for a standard Arabic sentiment : analysis corpus. The International Arab Journal of Information Technology Vol. 13, no. 1A (2016), pp.163-170.
https://search.emarefa.net/detail/BIM-758307
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Kabi, Muhammad& al-Ayyub, Mahmud& al-Smadi, Izzat& Wahshih, Haydar. Prototype for a standard Arabic sentiment : analysis corpus. The International Arab Journal of Information Technology. 2016. Vol. 13, no. 1A(s), pp.163-170.
https://search.emarefa.net/detail/BIM-758307
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes appendices : p. 170
رقم السجل
BIM-758307
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر