التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية
Other Title(s)
The probabilistic analysis of arabic binomials : a corpus-based study
Author
Source
مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية
Issue
Vol. 30, Issue 7 (31 Dec. 2022), pp.401-430, 30 p.
Publisher
King Abdulaziz University Scientific Publishing Center
Publication Date
2022-12-31
Country of Publication
Saudi Arabia
No. of Pages
30
Main Subjects
Arabic language and Literature
Abstract AR
تشير الأبحاث العالمية القائمة على التجريب و الحدس و المدونات اللغوية إلى أن ثمة عوامل تؤثر في ترتيب مستعمل اللغة لحدي العبارة الثنائية الحدين.
و في هذه الورقة خللت ۱۰۰۰ عبارة عربية ثنائية الحدين بالاعتماد على المدونة الفرعية من (مدونة الويب العربي ٢٠١٢ : آر تن تن 2012 Arabic Web ۲۰۱۲ : (arTenTen12) ذات النصوص العربية الفصيحة الموسومة نحويا بموسم ستانفورد و المتضمنة 990,596,٤٢٩ كلمة فعلية.
و قد كشفت الورقة تجريبيا من خلال نموذج الانحدار اللوجيستي عن واقع خمسة من القيود الواردة في الأدبيات السابقة و المؤثرة في ترتيب حدي العبارات الثنائية الحدين.
و أظهرت القيم الإحصائية و الاحتمالية للنموذج تباينا في درجة أثر هذه القيود على ترتيب حدي العبارات، و تبين أن أكثرها تأثيرا هو قيد الموسومية فيما استبعد قيد الألفبائية لعدم دلالته الإحصائية.
و قد تمكن النموذج بالقيود الأربعة من تفسير حوالي 0.48 من ثبات العبارات الثنائية الحدين، و أظهر أيضا قدرة على التعلم، فقدم نتائج مقبولة في مقاييس الصحة و الدقة و الاسترجاع.
و من المتوقع أن زيادة حجم البيانات و إضافة قيود أخرى سيسهمان في تفسير ترتيب العبارات الثنائية الحدين أكثر، و سيزيدان من دقة أداء النموذج.
Abstract EN
International research using experimental, intuition-based, and corpus-based methods indicates that there are factors can play a role in the ordering preferences of binomials.
in this paper, i analysed 1000 Arabic binomials based on the sub-corpus of (Arabic Web 2012 : arTenTen12) which is consisted of 429,990,596 tokens from Standard Arabic texts grammatically tagged with stanford tagger.
the paper has experimentally found through conducting a logistic regression analysis of binomials that five constraints mentioned in the previous literature affect binomial ordering.
the statistical and probability values of our model showed a variation in the ranks of influence of these constrains on the binomial ordering.
it was found that the most influential is markedness, while alphabetic was excluded due to statistically non-significant.
the best model with the four constraints was able to explain about 0.48 of the fixedness of binomial, and it also revealed learnability and showed good results in the measures of performance.
it is expected that increasing the size of the data and adding other constraints will increase contributing to the interpretation of the binomial ordering and will improve model performance.
American Psychological Association (APA)
التميمي، أفراح عبد العزيز. 2022. التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية. مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية،مج. 30، ع. 7، ص ص. 401-430.
https://search.emarefa.net/detail/BIM-1521243
Modern Language Association (MLA)
التميمي، أفراح عبد العزيز. التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية. مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية مج. 30، ع. 7 (2022)، ص ص. 401-430.
https://search.emarefa.net/detail/BIM-1521243
American Medical Association (AMA)
التميمي، أفراح عبد العزيز. التحليل الاحتمالي للعبارات الثنائية الحدين في العربية : دراسة مدونية حاسوبية. مجلة جامعة الملك عبد العزيز : الآداب و العلوم الإنسانية. 2022. مج. 30، ع. 7، ص ص. 401-430.
https://search.emarefa.net/detail/BIM-1521243
Data Type
Journal Articles
Language
Arabic
Notes
يتضمن مراجع ببليوجرافية : ص. 428-429
Record ID
BIM-1521243