Modified light stemming algorithm for Arabic language
العناوين الأخرى
الخوارزمية المعدلة لاستعادة الجذور في اللغة العربية
المؤلف
المصدر
العدد
المجلد 57، العدد 1B (31 مارس/آذار 2016)، ص ص. 507-513، 7ص.
الناشر
تاريخ النشر
2016-03-31
دولة النشر
العراق
عدد الصفحات
7
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
اللغة العربية وآدابها
الموضوعات
الملخص AR
استعادة الجذر هي خطوة معالجة مسبقة في تطبيقات استخراج أصول الكلمات و كذلك تعد ذات أهمية كبيرة في معظم أنظمة استرجاع المعلومات.
الهدف من استعادة الجذر هو تقليل الصيغ النحوية المختلفة للكلمة و أحيانا صيغ الاشتقاق للكلمة إلى صيغة الأساس (جذر أو أصل) الكلمة، مثل استرجاع الاسم، الصفة، الظرف، الفعل إلى الأصل الذي جاءت منه.
الجذر لا يكون بالضرورة مطابق للجذر النحوي للكلمة، عادة يكفي أن الكلمات ذات الصلة تؤدي إلى نفس الجذر حتى لو كان هذا الجذر ليس الجذر الصحيح.
كما في بقية اللغات نحتاج إلى خوارزمية فعالة لفهرسة و استرجاع النصوص باللغة العربية حيث أن خوارزميات استعادة الجذور باللغة العربية التوفر بصورة واسعة.
في هذه الخوارزمية سوف نحتاج إلى معالجة مسبقة للكلمات العربية ثم نقارن الكلمة الناتجة مع مجموعة من صيغ الكلمات العربية لاسترجاع جذر الكلمة.
في هذا البحث عدلت خوارزمية استعادة الجذور و أثبتت النتائج كفاءة هذه الخوارزمية.
الملخص EN
Stemming is a pre-processing step in Text mining applications as well as it is very important in most of the Information Retrieval systems.
The goal of stemming is to reduce different grammatical forms of a word and sometimes derivationally related forms of a word to a common base (root or stem) form like reducing noun, adjective, verb, adverb etc.
to its base form.
The stem needs not to be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root.
As in other languages; there is a need for an effective stemming algorithm for the indexing and retrieval of Arabic documents while the Arabic stemming algorithms are not widely available.
The current algorithm will perform preprocessing operations then matches the result word to Arabic patterns to get the stem of the word.
This paper proposed a modified light stemming algorithm for Arabic Languages.
As shown from the results, the proposed algorithm is an efficient algorithm.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Samir, Rafal Ali. 2016. Modified light stemming algorithm for Arabic language. Iraqi Journal of Science،Vol. 57, no. 1B, pp.507-513.
https://search.emarefa.net/detail/BIM-688477
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Samir, Rafal Ali. Modified light stemming algorithm for Arabic language. Iraqi Journal of Science Vol. 57, no. 1B (2016), pp.507-513.
https://search.emarefa.net/detail/BIM-688477
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Samir, Rafal Ali. Modified light stemming algorithm for Arabic language. Iraqi Journal of Science. 2016. Vol. 57, no. 1B, pp.507-513.
https://search.emarefa.net/detail/BIM-688477
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 513
رقم السجل
BIM-688477
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر