الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني
Author
Source
Issue
Vol. 22, Issue 49 (31 Mar. 2020), pp.197-219, 23 p.
Publisher
Supreme Council of the Arabic language
Publication Date
2020-03-31
Country of Publication
Algeria
No. of Pages
23
Main Subjects
Literature
Arabic language and Literature
Topics
Abstract AR
إن رقمنة مدونات اللغة العربية هي بداية لمشروع الذخيرة اللغوية العربية و كذا لمشروع المعجم التاريخي للغة العربية وذلك لأجل التعامل معها آليا و استرجاع المعلومات و التنقيب في البيانات إلا أنه حين أردنا التعامل مع إحدى هذه المدونات و المتمثلة في المعجم الوسيط الذي ألفه مجمع القاهرة في طبعته الرابعة وذلك باسترجاع أو بالقراءة الآلية للصيغ الصرفية المشتقة من الفعل الثلاثي المجرد الواردة كمداخل معجمية و كذا التعريف المعجمي الذي يأتي بعده واجهتنا عدة إشكالات بعضها متعلقة بطريقة رقمنة مدونة المعجم الوسيط و بعضها متعلقة بخصائص اللغة العربية و بعضها بواضعي المعجم ما جعلنا مجبرين على تصفية النتائج المحصل عليها بعد كل قراءة آلية لصيغة صرفية معينة من مدونة المعجم الوسيط الرقمي أو الإلكتروني و الدعوة إلى إعادة النظر في رقمنة المدونات العربية لأجل التعامل معها بلغات البرمجة دون إشكالات.
Abstract EN
The digitization of the corpora of the Arabic language is the beginning of the "thesaurus" project, as well as the Arabic "historical lexicon" project.
This digitization makes it possible to apply certain automatic processing procedures to real linguistic samples such as: automatic search, information retrieval, etc.
.
.
.
As far as we are concerned, we have adopted as a digital corpus the lexicon "Al muajem Al Wassit " conceived by a team from the Arabic Academy of Cairo, in its fourth edition, and we tried to apply an automatic search mechanism in all the lexical entries of the different schemes (morphological forms) derived from the trilitary mujarrad verbs, as well as the lexical definition that follows.
We have encountered several difficulties, some of which relate to the digitization of our adopted lexicon (Al Muajem Al Wassit), others relate to the features of the Arabic language, and finally, others relate to the obsolete lexicographical techniques of this lexicon.
For these reasons, we had to filter the results obtained after each automatic extraction of a scheme from the electronic version of our lexicon.
Our conclusion is an appeal to all actors in the lexicological and lexicographical field of the Arabic language, to question their techniques and methodology of corpora digitization of the Arabic language.
American Psychological Association (APA)
حجبار، رادية. 2020. الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني. اللغة العربية،مج. 22، ع. 49، ص ص. 197-219.
https://search.emarefa.net/detail/BIM-987117
Modern Language Association (MLA)
حجبار، رادية. الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني. اللغة العربية مج. 22، ع. 49 (2020)، ص ص. 197-219.
https://search.emarefa.net/detail/BIM-987117
American Medical Association (AMA)
حجبار، رادية. الاسترجاع الآلي للصيغ الصرفية من المعجم الوسيط الإلكتروني. اللغة العربية. 2020. مج. 22، ع. 49، ص ص. 197-219.
https://search.emarefa.net/detail/BIM-987117
Data Type
Journal Articles
Language
Arabic
Notes
يتضمن مراجع ببليوجرافية : ص. 218-219
Record ID
BIM-987117