A hybrid approach for urdu sentence boundary disambiguation

المؤلفون المشاركون

Rahman, Zobia
Anwar, Waqas

المصدر

The International Arab Journal of Information Technology

العدد

المجلد 9، العدد 3 (31 مايو/أيار 2012)، ص ص. 250-255، 6ص.

الناشر

جامعة الزرقاء

تاريخ النشر

2012-05-31

دولة النشر

الأردن

عدد الصفحات

6

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص EN

Sentence boundary identification is a preliminary step for preparing a text document for Natural Language Processing tasks, e.g., machine translation, POS tagging, text summarization and etc.

We present a hybrid approach for Urdu sentence boundary disambiguation comprising of unigram statistical model and rule based algorithm.

After implementing this approach, we obtained 99.48 % precision, 86.35 % recall and 92.45 % F1-Measure while keeping training and testing data different from each other, and with same training and testing data, we obtained 99.36 % precision, 96.45 % recall and 97.89 % F1-Measure.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Rahman, Zobia& Anwar, Waqas. 2012. A hybrid approach for urdu sentence boundary disambiguation. The International Arab Journal of Information Technology،Vol. 9, no. 3, pp.250-255.
https://search.emarefa.net/detail/BIM-305255

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Rahman, Zobia& Anwar, Waqas. A hybrid approach for urdu sentence boundary disambiguation. The International Arab Journal of Information Technology Vol. 9, no. 3 (May. 2012), pp.250-255.
https://search.emarefa.net/detail/BIM-305255

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Rahman, Zobia& Anwar, Waqas. A hybrid approach for urdu sentence boundary disambiguation. The International Arab Journal of Information Technology. 2012. Vol. 9, no. 3, pp.250-255.
https://search.emarefa.net/detail/BIM-305255

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 255

رقم السجل

BIM-305255