Exploiting multilingual Wikipedia to improve Arabic named entity resources
المؤلفون المشاركون
Tedmori, Sara
Baltawi, Maryam
Ujan, Arafat
al-Kuz, Akram
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 14، العدد 4A (s) (31 يوليو/تموز 2017)، ص ص. 598-607، 10ص.
الناشر
تاريخ النشر
2017-07-31
دولة النشر
الأردن
عدد الصفحات
10
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
This paper focuses on the creation of Arabic named entity gazetteers, by exploiting Wikipedia and using the Naïve Bayes classifier to classify the named entities into the three main categories: person, location, and organization.
The process of building the gazetteer starts with automatically creating the datasets.
The dataset for the training is constructed using only Arabic text, whereas, the testing dataset is derived from an English text using the Stanford name entity recognizer.
A Wikipedia title existence check of these English name entities is then performed.
Next, if the named entity exists as a Wikipedia page title, a check for Arabic parallel pages is conducted.
Finally, the Naïve Bayes classifier is applied to verify or assign new name entity tag to the Arabic name entity.
Due to the lack of available resources, the proposed system is evaluated manually by calculating accuracy, recall, and precision.
Results show an accuracy of 53 %.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Ujan, Arafat& Baltawi, Maryam& Tedmori, Sara& al-Kuz, Akram. 2017. Exploiting multilingual Wikipedia to improve Arabic named entity resources. The International Arab Journal of Information Technology،Vol. 14, no. 4A (s), pp.598-607.
https://search.emarefa.net/detail/BIM-902970
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Baltawi, Maryam…[et al.]. Exploiting multilingual Wikipedia to improve Arabic named entity resources. The International Arab Journal of Information Technology Vol. 14, no. 4A (Special issue) (2017), pp.598-607.
https://search.emarefa.net/detail/BIM-902970
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Ujan, Arafat& Baltawi, Maryam& Tedmori, Sara& al-Kuz, Akram. Exploiting multilingual Wikipedia to improve Arabic named entity resources. The International Arab Journal of Information Technology. 2017. Vol. 14, no. 4A (s), pp.598-607.
https://search.emarefa.net/detail/BIM-902970
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes appendices : p. 605-607
رقم السجل
BIM-902970
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر