الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني

المؤلف

حجبار، رادية

المصدر

اللغة العربية

العدد

المجلد 22، العدد 49 (31 مارس/آذار 2020)، ص ص. 197-219، 23ص.

الناشر

المجلس الأعلى للغة العربية

تاريخ النشر

2020-03-31

دولة النشر

الجزائر

عدد الصفحات

23

التخصصات الرئيسية

الآداب
اللغة العربية وآدابها

الموضوعات

الملخص AR

إن رقمنة مدونات اللغة العربية هي بداية لمشروع الذخيرة اللغوية العربية و كذا لمشروع المعجم التاريخي للغة العربية وذلك لأجل التعامل معها آليا و استرجاع المعلومات و التنقيب في البيانات إلا أنه حين أردنا التعامل مع إحدى هذه المدونات و المتمثلة في المعجم الوسيط الذي ألفه مجمع القاهرة في طبعته الرابعة وذلك باسترجاع أو بالقراءة الآلية للصيغ الصرفية المشتقة من الفعل الثلاثي المجرد الواردة كمداخل معجمية و كذا التعريف المعجمي الذي يأتي بعده واجهتنا عدة إشكالات بعضها متعلقة بطريقة رقمنة مدونة المعجم الوسيط و بعضها متعلقة بخصائص اللغة العربية و بعضها بواضعي المعجم ما جعلنا مجبرين على تصفية النتائج المحصل عليها بعد كل قراءة آلية لصيغة صرفية معينة من مدونة المعجم الوسيط الرقمي أو الإلكتروني و الدعوة إلى إعادة النظر في رقمنة المدونات العربية لأجل التعامل معها بلغات البرمجة دون إشكالات.

الملخص EN

The digitization of the corpora of the Arabic language is the beginning of the "thesaurus" project, as well as the Arabic "historical lexicon" project.

This digitization makes it possible to apply certain automatic processing procedures to real linguistic samples such as: automatic search, information retrieval, etc.

.

.

.

As far as we are concerned, we have adopted as a digital corpus the lexicon "Al muajem Al Wassit " conceived by a team from the Arabic Academy of Cairo, in its fourth edition, and we tried to apply an automatic search mechanism in all the lexical entries of the different schemes (morphological forms) derived from the trilitary mujarrad verbs, as well as the lexical definition that follows.

We have encountered several difficulties, some of which relate to the digitization of our adopted lexicon (Al Muajem Al Wassit), others relate to the features of the Arabic language, and finally, others relate to the obsolete lexicographical techniques of this lexicon.

For these reasons, we had to filter the results obtained after each automatic extraction of a scheme from the electronic version of our lexicon.

Our conclusion is an appeal to all actors in the lexicological and lexicographical field of the Arabic language, to question their techniques and methodology of corpora digitization of the Arabic language.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

حجبار، رادية. 2020. الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني. اللغة العربية،مج. 22، ع. 49، ص ص. 197-219.
https://search.emarefa.net/detail/BIM-987117

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

حجبار، رادية. الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني. اللغة العربية مج. 22، ع. 49 (2020)، ص ص. 197-219.
https://search.emarefa.net/detail/BIM-987117

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

حجبار، رادية. الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني. اللغة العربية. 2020. مج. 22، ع. 49، ص ص. 197-219.
https://search.emarefa.net/detail/BIM-987117

نوع البيانات

مقالات

لغة النص

العربية

الملاحظات

يتضمن مراجع ببليوجرافية : ص. 218-219

رقم السجل

BIM-987117