التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة

العناوين الأخرى

Automated processing of linguistic heritage corpuses between characteristics of the programming language and digitization errors.programming language and digitization errors

المؤلف

حجبار، رادية

المصدر

مجلة إشكالات في اللغة و الأدب

العدد

المجلد 10، العدد 2 (31 ديسمبر/كانون الأول 2021)، ص ص. 102-116، 15ص.

الناشر

المركز الجامعي أمين العقال الحاج موسى أق أخموك لتامنغست معهد الآداب و اللغات

تاريخ النشر

2021-12-31

دولة النشر

الجزائر

عدد الصفحات

15

التخصصات الرئيسية

اللغات والآداب المقارنة

الموضوعات

الملخص AR

إن الهدف من رقمنة مدونات اللغة العربية هو التعامل معها آليا وذلك من خلال استرجاع المفردات و المعلومات و التنقيب في البيانات.

و سنبين في بحثنا هذا كيفية التعامل مع المدونات اللغوية التراثية الرقمية آليا و التي اخترنا منها معجم لسان العرب لابن منظور كتاب الجامع لمفردات الأدوية و الأغذية لابن بيطار و معجم الإبل للأصمعي.

و لكن كيف يتم توصيف المفردات الواردة في هذه المدونات التراثية للحاسوب وهل تسمح لنا لغة البرمجة باسترجاع كل المفردات مهما كان شكلها أو بنيتها وماهي اللوغاريتمات المناسبة للاسترجاع الآلي في حال كانت رقمنة المدونات غير مضبوطةولأجل الإجابة عن هذه الإشكالات أنشأنا خوارزميات تتضمن توصيفا دقيقا للمفردة من حيث حروفها وحركاتها و كذا للواصق التي يحتمل أن تلتصق بها لتتحقق القراءة لجميع المفردات و التراكيب المراد استرجاعها آليا من قاعدة البيانات.

و ننتهي من خلال الاسترجاع الآلي لبعض الصيغ و المفردات من نماذج من المدونات اللغوية التراثية إلى وجوب إعادة النظر في رقمنة هذه المدونات لأجل التعامل معها بلغات البرمجة دون إشكالات

الملخص EN

The aim of digitizing Arabic language blogs is to deal with them automatically, as well as to accomplish the historical Arabic lexicon project, by retrieving vocabulary, information and data mining.

In this research, we will show how to deal with the digital heritage linguistic blogs automatically, from which we chose the dictionary of « IBIL » of « Asma'i «, the book of «the collection of the vocabulary of medicines and food» for Ibn Baytar, and the dictionary of the « Arabic tongue » by Ibn Mandhour.

But how are these vocabulary words described in the heritage blogs of the computer described? Does the programming language allow us to retrieve all vocabulary, regardless of shape or structure? What are the appropriate logarithms for automatic retrieval if the digitization of blogs is not accurate and innacurate? In order to answer these problems, we have created algorithms and instructions that include an accurate description of the individual, in terms of its letters and movements, as well as the stickers that are likely to stick to them, so that the reading of all the vocabulary and structures to be retrieved automatically from the database is achieved.

We conclude, through the automatic retrieval of some formulas and vocabulary, from examples of heritage linguistic codes to the need to review the digitization of these codes in order to deal with them in programming languages without problems.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

حجبار، رادية. 2021. التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة. مجلة إشكالات في اللغة و الأدب،مج. 10، ع. 2، ص ص. 102-116.
https://search.emarefa.net/detail/BIM-1233555

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

حجبار، رادية. التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة. مجلة إشكالات في اللغة و الأدب مج. 10، ع. 2 (2021)، ص ص. 102-116.
https://search.emarefa.net/detail/BIM-1233555

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

حجبار، رادية. التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة. مجلة إشكالات في اللغة و الأدب. 2021. مج. 10، ع. 2، ص ص. 102-116.
https://search.emarefa.net/detail/BIM-1233555

نوع البيانات

مقالات

لغة النص

العربية

الملاحظات

-

رقم السجل

BIM-1233555