التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة

Other Title(s)

Automated processing of linguistic heritage corpuses between characteristics of the programming language and digitization errors.programming language and digitization errors

Author

حجبار، رادية

Source

مجلة إشكالات في اللغة و الأدب

Issue

Vol. 10, Issue 2 (31 Dec. 2021), pp.102-116, 15 p.

Publisher

University Center of Tamanghasset Institute of arts and languages

Publication Date

2021-12-31

Country of Publication

Algeria

No. of Pages

15

Main Subjects

Languages & Comparative Literature

Topics

Abstract AR

إن الهدف من رقمنة مدونات اللغة العربية هو التعامل معها آليا وذلك من خلال استرجاع المفردات و المعلومات و التنقيب في البيانات.

و سنبين في بحثنا هذا كيفية التعامل مع المدونات اللغوية التراثية الرقمية آليا و التي اخترنا منها معجم لسان العرب لابن منظور كتاب الجامع لمفردات الأدوية و الأغذية لابن بيطار و معجم الإبل للأصمعي.

و لكن كيف يتم توصيف المفردات الواردة في هذه المدونات التراثية للحاسوب وهل تسمح لنا لغة البرمجة باسترجاع كل المفردات مهما كان شكلها أو بنيتها وماهي اللوغاريتمات المناسبة للاسترجاع الآلي في حال كانت رقمنة المدونات غير مضبوطةولأجل الإجابة عن هذه الإشكالات أنشأنا خوارزميات تتضمن توصيفا دقيقا للمفردة من حيث حروفها وحركاتها و كذا للواصق التي يحتمل أن تلتصق بها لتتحقق القراءة لجميع المفردات و التراكيب المراد استرجاعها آليا من قاعدة البيانات.

و ننتهي من خلال الاسترجاع الآلي لبعض الصيغ و المفردات من نماذج من المدونات اللغوية التراثية إلى وجوب إعادة النظر في رقمنة هذه المدونات لأجل التعامل معها بلغات البرمجة دون إشكالات

Abstract EN

The aim of digitizing Arabic language blogs is to deal with them automatically, as well as to accomplish the historical Arabic lexicon project, by retrieving vocabulary, information and data mining.

In this research, we will show how to deal with the digital heritage linguistic blogs automatically, from which we chose the dictionary of « IBIL » of « Asma'i «, the book of «the collection of the vocabulary of medicines and food» for Ibn Baytar, and the dictionary of the « Arabic tongue » by Ibn Mandhour.

But how are these vocabulary words described in the heritage blogs of the computer described? Does the programming language allow us to retrieve all vocabulary, regardless of shape or structure? What are the appropriate logarithms for automatic retrieval if the digitization of blogs is not accurate and innacurate? In order to answer these problems, we have created algorithms and instructions that include an accurate description of the individual, in terms of its letters and movements, as well as the stickers that are likely to stick to them, so that the reading of all the vocabulary and structures to be retrieved automatically from the database is achieved.

We conclude, through the automatic retrieval of some formulas and vocabulary, from examples of heritage linguistic codes to the need to review the digitization of these codes in order to deal with them in programming languages without problems.

American Psychological Association (APA)

حجبار، رادية. 2021. التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة. مجلة إشكالات في اللغة و الأدب،مج. 10، ع. 2، ص ص. 102-116.
https://search.emarefa.net/detail/BIM-1233555

Modern Language Association (MLA)

حجبار، رادية. التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة. مجلة إشكالات في اللغة و الأدب مج. 10، ع. 2 (2021)، ص ص. 102-116.
https://search.emarefa.net/detail/BIM-1233555

American Medical Association (AMA)

حجبار، رادية. التعامل الآلي مع المدونات اللغوية التراثية بين خصائص لغة البرمجة و أخطاء الرقمنة. مجلة إشكالات في اللغة و الأدب. 2021. مج. 10، ع. 2، ص ص. 102-116.
https://search.emarefa.net/detail/BIM-1233555

Data Type

Journal Articles

Language

Arabic

Notes

-

Record ID

BIM-1233555