An Arabic morphological analyzer-synthesizer

Other Title(s)

محلل و مركب صرفي عربي

Joint Authors

Khayyat, Muhammad Ghazzali
al-Uthman, Abd al-Aziz
al-Safran, Safran

Source

Journal of King Abdulaziz University : Engineering Sciences

Issue

Vol. 13, Issue 1 (30 Jun. 2001), pp.71-93, 23 p.

Publisher

King Abdulaziz University Scientific Publishing Center

Publication Date

2001-06-30

Country of Publication

Saudi Arabia

No. of Pages

23

Main Subjects

Arabic language and Literature

Topics

Abstract AR

يمثل الصرف عنصرا أساسيا في معالجة اللغة العربية آليا.

و حيث أن للصرف في اللغة العربية قواعد واضحة فإنه يمكن برمجة التحليل و التركيب الصرفي بسهولة.

و الهدف من هذا البحث هو تصميم و تطوير محلل و مركب صرفي عربي.

و في حالة التحليل يقوم المحلل بتحديد الخصائص التالية للكلمة : النوع (اسم، فعل، حرف)، و الضمير و العدد و الجنس (للأسماء و الأفعال)، و حالة الفعل (ماضي، مضارع، أمر)، نوع الحرف (استفهام، جر، ....إلخ)، و الجذر، و الوزن (للأسماء و الأفعال)، و الزوائد (قبلية، وسطية، بعدية).

و في حالة التركيب يقوم البرنامج بتركيب الكلمة من الخصاص المذكورة أعلاه.

لقد تم تطوير البرنامج بناء على قواعد الصرف العربي.

و تم تصميم البرنامج كثلاث وحدات للحروف و الأسماء و الأفعال.

و تتكون كل وحدة من قواعد برمجية تمثل قواعد الصرف العربي.

و يحدد البرنامج الحالة (تحليل أو تركيب) تلقائيا من المعطيات.

و قد تم تمثيل الأوزان المختلفة لكلمة تتكون من عدد س من الحروف كقواعد لغة برولوج مرتبة و وفقا لتردد استخدام الوزن.

و يستخدم عدد الحروف التي تتكون منها الكلمة و تردد الوزن لتقليل وقت البحث عن التركيب أو التحليل الصحيح في البرنامج.

هذا و يتم استخدام البرنامج المطور حاليا كوحدة في نظام لفهم اللغة العربية.

كما يمكن استخدام البرنامج في الترجمة الآلية، و النظم الآلية، لتعليم اللغة العربية، و نظم التعرف على الكلام المكتوب، و نظم معالجة الكلام المنطوق.

Abstract EN

Morphology is an essential element in processing natural language.

As morphology in Arabic is highly derivational, morphological analysis/synthesis is systematic and can be easily automated.

The objective of this research work is to design and implement a morphological analyzer/synthesizer (MAS) for Arabic.

In analysis mode, given a word, MAS determines the following properties of words: 1) type (noun, verb, article), 2) person, number and gender (for verbs and nouns), 3) tense of verb (past, present, imperative), 4) type of article (interrogative, prepositional, etc.), 5) root, and derivation (for verbs and nouns), and 6) type and identity of affixes (prefix, infix, suffix).

In synthesis mode, the above properties are given and the corresponding word is constructed.

MAS is based on linguistic principles of Arabic morphology.

It is designed as three modules for particles, nouns and verbs respectively.

The modules consist of rules that encode the linguistic principles of word construction in Arabic.

The mode (analysis or synthesis) of operation is automatically determined by the values associated with the word and its properties.

For a word of size n of a particular type (noun, verb or article), the possible derivations (determined according to the linguistic principles) are implemented as ordered (according to their frequencies of occurrence) Prolog predicates.

The size of the word and frequency of occurrence of the corresponding derivation are used to minimize the search time.

MAS is currently being used as a component of a natural Arabic understanding system.

It can also be used in translation, computeraided Arabic learning, character recognition and text and speech processing systems.

American Psychological Association (APA)

Khayyat, Muhammad Ghazzali& al-Uthman, Abd al-Aziz& al-Safran, Safran. 2001. An Arabic morphological analyzer-synthesizer. Journal of King Abdulaziz University : Engineering Sciences،Vol. 13, no. 1, pp.71-93.
https://search.emarefa.net/detail/BIM-370544

Modern Language Association (MLA)

Khayyat, Muhammad Ghazzali…[et al.]. An Arabic morphological analyzer-synthesizer. Journal of King Abdulaziz University : Engineering Sciences Vol. 13, no. 1 (2001), pp.71-93.
https://search.emarefa.net/detail/BIM-370544

American Medical Association (AMA)

Khayyat, Muhammad Ghazzali& al-Uthman, Abd al-Aziz& al-Safran, Safran. An Arabic morphological analyzer-synthesizer. Journal of King Abdulaziz University : Engineering Sciences. 2001. Vol. 13, no. 1, pp.71-93.
https://search.emarefa.net/detail/BIM-370544

Data Type

Journal Articles

Language

English

Notes

Includes appendices : p. 92

Record ID

BIM-370544