Parsing Arabic texts using real patterns of syntactic trees

المؤلفون المشاركون

Bin Faraj, F.
Zribi, C. Bin Uthman
Bin Ahmad, M.

المصدر

The Arabian Journal for Science and Engineering. Section C, Theme issues

العدد

المجلد 35، العدد 2C(s) (31 ديسمبر/كانون الأول 2010)، ص ص. 84-101، 18ص.

الناشر

جامعة الملك فهد للبترول و المعادن

تاريخ النشر

2010-12-31

دولة النشر

السعودية

عدد الصفحات

18

التخصصات الرئيسية

اللغات والآداب المقارنة
تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

يقدم هذا البحث طريقة جديدة للتحليل الالكتروني للنصوص العربية تحليلا نحويا عميقا.

و قد اخترنا في هذا البحث أن نعتمد على التعلم الالكتروني.

و يتم التعلم من بنك للمعلومات يحتوي على جمل محللة نحويا.

ففي خطوة أولى، نقوم باستخلاص نماذج التحاليل النحوية من البنك.

و تمثل هذه النماذج عدة تراكيب نحوية مكونة من مجموعة من الطبقات كما أنها غنية بشتى أنواع المعلومات: النحوية، التركيبية، الاشتقاقية و السياقية.

نستعمل هذه النماذج لتوجيه التعامل مع الجمل.

فالمحلل النحوي الالكتروني يعمل بتعاقب لأنه يحلل الجملة على مراحل مكملة بعضها البعض.

و عدد هذه المراحل يساوي عدد الكلمات المكونة للجملة.

في كل مرحلة، يتم البحث عن النماذج المحتملة التي يمكنها تمثيل كلمة معينة في السياق الذي تنتمي إليه.

ثم يتم تركيب النماذج المختارة مع النماذج التي تم الحصول عليها في المراحل السابقة.

في نهاية التحليل يمكننا تكوين مجموعة من التراكيب النحوية الكاملة المحتملة للجملة ككل.

عندئذ يتم ترتيب التراكيب بالاعتماد على تواتر تواجدها في بنك الجمل المحللة.

مكنتنا النتائج الأولية للاختبارات من الحصول على معدلات مرضية (دقة في التحليل تساوي 84<8% و أف – سكور مساو لـ 77,5%).

الملخص EN

-In order to parse Arabic texts, we have chosen to use a machine learning approach.

It learns from an Arabic Treebank.

The knowledge enclosed in this Treebank is structured as patterns of syntactic trees.

These patterns are representative models of the Arabic syntactic components.

They are both layered and rich structurally and contextually.

They serve as an informational source for guiding the parsing process.

Our parser is progressive since it proceeded by treating a sentence into a number of stages equal to the number of its words.

At every step, the parser affects the target word with the most likely patterns that represent it in the context where it is put.

Then, it joins the selected patterns with those collected in the previous parsing steps in order to construct the representative syntactic tree (s) of the whole sentence.

If more than one tree is proposed, all the analysis trees are sorted according to their appearance frequencies in the Treebank.

The preliminary tests have yielded accuracy and f-score equal to 84.8 % and 77.5 % respectively.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Bin Faraj, F.& Zribi, C. Bin Uthman& Bin Ahmad, M.. 2010. Parsing Arabic texts using real patterns of syntactic trees. The Arabian Journal for Science and Engineering. Section C, Theme issues،Vol. 35, no. 2C(s), pp.84-101.
https://search.emarefa.net/detail/BIM-308408

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Bin Faraj, F.…[et al.]. Parsing Arabic texts using real patterns of syntactic trees. The Arabian Journal for Science and Engineering. Section C, Theme issues Vol. 35, no. 2C(s) (Dec. 2010), pp.84-101.
https://search.emarefa.net/detail/BIM-308408

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Bin Faraj, F.& Zribi, C. Bin Uthman& Bin Ahmad, M.. Parsing Arabic texts using real patterns of syntactic trees. The Arabian Journal for Science and Engineering. Section C, Theme issues. 2010. Vol. 35, no. 2C(s), pp.84-101.
https://search.emarefa.net/detail/BIM-308408

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 99-101

رقم السجل

BIM-308408