Prediction of part of speech tags for Punjabi using support vector machines
المؤلفون المشاركون
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 13، العدد 6 (31 ديسمبر/كانون الأول 2016)6ص.
الناشر
تاريخ النشر
2016-12-31
دولة النشر
الأردن
عدد الصفحات
6
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الموضوعات
الملخص EN
Part-of-Speech (POS) tagging is a task of assigning the appropriate POS or l^^ical category to each word in a natural language sentence.
In this paper, we have worked on automated annotation of POS tags for Punjabi.
We have collected a corpus of around 27,000 words, which included the text from various stories, essays, day-to-day conversations, poems etc., and divided these words into different size files for training and testing purposes.
In our approach, we have used Support Vector Machine (SVM) for tagging Punjabi sentences.
To the best of our knowledge, SVMs have never been used for tagging Punjabi text.
The result shows that SVM based tagger has outperformed the existing taggers.
In the existing POS taggers of Punjabi, the accuracy of POS tagging for unknown words is less than that for known words.
But in our proposed tagger, high accuracy has been achieved for unknown and ambiguous words.
The average accuracy of our tagger is 89.8 which is better than the existing approaches.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Kumar, Dinesh& Josan, Gurpreet. 2016. Prediction of part of speech tags for Punjabi using support vector machines. The International Arab Journal of Information Technology،Vol. 13, no. 6.
https://search.emarefa.net/detail/BIM-654819
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Kumar, Dinesh& Josan, Gurpreet. Prediction of part of speech tags for Punjabi using support vector machines. The International Arab Journal of Information Technology Vol. 13, no. 6 (Dec. 2016).
https://search.emarefa.net/detail/BIM-654819
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Kumar, Dinesh& Josan, Gurpreet. Prediction of part of speech tags for Punjabi using support vector machines. The International Arab Journal of Information Technology. 2016. Vol. 13, no. 6.
https://search.emarefa.net/detail/BIM-654819
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes appendix.
رقم السجل
BIM-654819
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر