التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية

Other Title(s)

The probabilistic analysis of arabic binomials : a corpus-based study

Author

التميمي، أفراح عبد العزيز

Source

مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية

Issue

Vol. 30, Issue 7 (31 Dec. 2022), pp.401-430, 30 p.

Publisher

King Abdulaziz University Scientific Publishing Center

Publication Date

2022-12-31

Country of Publication

Saudi Arabia

No. of Pages

30

Main Subjects

Arabic language and Literature

Abstract AR

تشير الأبحاث العالمية القائمة على التجريب و الحدس و المدونات اللغوية إلى أن ثمة عوامل تؤثر في ترتيب مستعمل اللغة لحدي العبارة الثنائية الحدين.

و في هذه الورقة خللت ۱۰۰۰ عبارة عربية ثنائية الحدين بالاعتماد على المدونة الفرعية من (مدونة الويب العربي ٢٠١٢ : آر تن تن 2012 Arabic Web ۲۰۱۲ : (arTenTen12) ذات النصوص العربية الفصيحة الموسومة نحويا بموسم ستانفورد و المتضمنة 990,596,٤٢٩ كلمة فعلية.

و قد كشفت الورقة تجريبيا من خلال نموذج الانحدار اللوجيستي عن واقع خمسة من القيود الواردة في الأدبيات السابقة و المؤثرة في ترتيب حدي العبارات الثنائية الحدين.

و أظهرت القيم الإحصائية و الاحتمالية للنموذج تباينا في درجة أثر هذه القيود على ترتيب حدي العبارات، و تبين أن أكثرها تأثيرا هو قيد الموسومية فيما استبعد قيد الألفبائية لعدم دلالته الإحصائية.

و قد تمكن النموذج بالقيود الأربعة من تفسير حوالي 0.48 من ثبات العبارات الثنائية الحدين، و أظهر أيضا قدرة على التعلم، فقدم نتائج مقبولة في مقاييس الصحة و الدقة و الاسترجاع.

و من المتوقع أن زيادة حجم البيانات و إضافة قيود أخرى سيسهمان في تفسير ترتيب العبارات الثنائية الحدين أكثر، و سيزيدان من دقة أداء النموذج.

Abstract EN

International research using experimental, intuition-based, and corpus-based methods indicates that there are factors can play a role in the ordering preferences of binomials.

in this paper, i analysed 1000 Arabic binomials based on the sub-corpus of (Arabic Web 2012 : arTenTen12) which is consisted of 429,990,596 tokens from Standard Arabic texts grammatically tagged with stanford tagger.

the paper has experimentally found through conducting a logistic regression analysis of binomials that five constraints mentioned in the previous literature affect binomial ordering.

the statistical and probability values of our model showed a variation in the ranks of influence of these constrains on the binomial ordering.

it was found that the most influential is markedness, while alphabetic was excluded due to statistically non-significant.

the best model with the four constraints was able to explain about 0.48 of the fixedness of binomial, and it also revealed learnability and showed good results in the measures of performance.

it is expected that increasing the size of the data and adding other constraints will increase contributing to the interpretation of the binomial ordering and will improve model performance.

American Psychological Association (APA)

التميمي، أفراح عبد العزيز. 2022. التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية. مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية،مج. 30، ع. 7، ص ص. 401-430.
https://search.emarefa.net/detail/BIM-1521243

Modern Language Association (MLA)

التميمي، أفراح عبد العزيز. التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية. مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية مج. 30، ع. 7 (2022)، ص ص. 401-430.
https://search.emarefa.net/detail/BIM-1521243

American Medical Association (AMA)

التميمي، أفراح عبد العزيز. التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية. مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية. 2022. مج. 30، ع. 7، ص ص. 401-430.
https://search.emarefa.net/detail/BIM-1521243

Data Type

Journal Articles

Language

Arabic

Notes

يتضمن مراجع ببليوجرافية : ص. 428-429

Record ID

BIM-1521243