Qur'anic words stemming

Joint Authors

Yusuf, Raja Jamilah Raja
Roziati, Zayn al-Din
Baba, Muhammad Sapiyan
Yusuf, Zulkifli Muhammad

Source

The Arabian Journal for Science and Engineering. Section C, Theme issues

Issue

Vol. 35, Issue 2C(s) (31 Dec. 2010), pp.38-49, 12 p.

Publisher

King Fahd University of Petroleum and Minerals

Publication Date

2010-12-31

Country of Publication

Saudi Arabia

No. of Pages

12

Main Subjects

Languages & Comparative Literature

Topics

Abstract AR

من المعروف أن الكلمات العربية لديها تركيب صرفي معقد.

إن التركيب المختلف ينتج أنماط كلمات مختلفة أو اشتقاقات من جذور الكلمة.

تحاول هذه الورقة التعرف إلى أنماط الكلمة المختلفة التي تنشأ من جذور الكلمة.

و قد تمت مقارنة أنماط الكلمة بالكلمات في الجزء الثلاثين من القرآن الكريم، و تم تحديد تسع حالات اختبار للكلمات في هذا الجزء.

و قد أظهر التحليل أن استئصال الأسماء و الجزئيات تقود إلى أقل نسبة خطأ بالمقارنة مع الأبجديات العشر التي يمكن أن تضاف إلى ملحقات جذر الكلمة.

كما تم تنفيذ محرك قائم على قواعد أساسية (RSE) و كانت الدقة الناشئة قد حققت 62.5 % و متوسط الزمن لإنجاز 1000 كلمة 11.7 ms .

و قد تمت مقارنة دقة النتاج بغيرها مثل Khoja، المحلل الصرفي (BAMA) Buckwalter و خوارزمية استخراج الجذور الثلاثي (TRE) و خوارزمية Voting.

Abstract EN

Arabic words are known to have complex morphological structure.

The different structures produce various word patterns or derivatives from a root word.

This paper attempts to identify various word patterns that originate from a root word.

These word patterns are compared to the words in the 30th part of the Qur'an.

Nine stemming test cases were outlined for words in the 30th part of the Qur’an.

Analysis showed that stemming nouns and particles leads to a lower percentage error compared to stemming the 10 alphabets that can be added as affixes in a root word.

A rule based stemming engine (RSE) was also implemented and the stemming accuracy achieved was 62.5 % and the average time taken to stem 1000 word tokens was 11.7ms.

The accuracy of the results was comparable to other stemming engines such as the Khoja stemmer, Buck Walter Morphological Analyzer (BAMA), Tri-literal Root Extraction (TRE) algorithm, and Voting algorithm.

American Psychological Association (APA)

Yusuf, Raja Jamilah Raja& Roziati, Zayn al-Din& Baba, Muhammad Sapiyan& Yusuf, Zulkifli Muhammad. 2010. Qur'anic words stemming. The Arabian Journal for Science and Engineering. Section C, Theme issues،Vol. 35, no. 2C(s), pp.38-49.
https://search.emarefa.net/detail/BIM-308346

Modern Language Association (MLA)

Yusuf, Raja Jamilah Raja…[et al.]. Qur'anic words stemming. The Arabian Journal for Science and Engineering. Section C, Theme issues Vol. 35, no. 2C(s) (Dec. 2010), pp.38-49.
https://search.emarefa.net/detail/BIM-308346

American Medical Association (AMA)

Yusuf, Raja Jamilah Raja& Roziati, Zayn al-Din& Baba, Muhammad Sapiyan& Yusuf, Zulkifli Muhammad. Qur'anic words stemming. The Arabian Journal for Science and Engineering. Section C, Theme issues. 2010. Vol. 35, no. 2C(s), pp.38-49.
https://search.emarefa.net/detail/BIM-308346

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 48-49

Record ID

BIM-308346