Theoretical and methodological foundations for corpus-based analysis of formulaic expression units

Other Title(s)

الأسس النظرية و المنهجية للتحليل لوحدات التعابير المركبة الجامدة حسب الأسس الإحصائية لقواعد البيانات اللغوية

Author

Uraybi, Muhammad Abd al-Zahrah

Source

lark Journal for Philosophy, linguistics and Social Sciences

Issue

Vol. 2, Issue 45 (30 Apr. 2022), pp.1151-1177, 27 p.

Publisher

Wasit University College of Arts

Publication Date

2022-04-30

Country of Publication

Iraq

No. of Pages

27

Main Subjects

Languages

Abstract AR

يتناول هذا البحث خاصية الجمود اللغوية للتعابير المركبة التي تترشح من مجموعة أسس و مبادئ عامة لها علاقة بالتركيب العقلي و التجسيد اللغوي وصيغ الاستخدام.

يكمن فهم طبيعة و تدرج الجمود اللغوي في التوزيع التكراري لمثل هذه التعابير عند المستويات النحوية و الدلالية و النصية.

إضافة الى المقاربات الاستطرادية النوعية عند دراسة للتعابير المركبة الجاهزة لابد من التوجه لمقاربات كمية إحصائية لدراسة التوزيع التكراري قابلة لبرهنة ثبوت الجمود اللغوي للتعابير و مقیاس حالة الجمود.

لتحصيل هذا الهدف يمكن الاعتماد على الأطر النظرية للدلالة التوزيعية و الدلالة الادراكية لشرح النتائج التحليلية.

التحليل الاحصائي الكمي يحتاج إلى قاعدة بيانات لغوية للتكون مجال للبحث و الحصول على نتائج توزيع تكراري تسجل عدد تكرار استخدام المستخدمين للغة لمثل هكذا تعابير و بنفس الصيغة في نصوص معينة أو مجالات معرفية معينة.

يكمن اسهام البحث في تكوين الأسس النظرية لتكوين نموذج احصائي يمكن استخدامه لبرهنة ثبوت الجمود اللغوي للتعابير و مقياس حالة الجمود و اقتراح استخدام نموذج الحدود القصوى لتكرار الاستخدام كنموذج قابل للتطبيق لبلوغ أهداف البحث.

Abstract EN

The description of the formulaic status of the linguistic behaviuor of the formulaic expression units (FEUS) arises from a set of universal principles underlying the mental organization and representation of language and conventionalized patterns of language use.

the nature and gradeability of formulaicity can be clued-up by the statistical distribution of such units at all levels of linguistic analysis including the syntactic, semantic, and discourse levels.

In addition to the existing discursive approach, the FEUs' formulaic status must be quantitively approached and verified by a corpus-based statistical analysis of distributional frequency.

appropriate theoretical frameworks, including distributional semantics and cognitive semantics, should undoubtedly unveil formalized semantic and cognitive parameters which could better fit for the distribution frequency statistical analysis of the linguistic data.

the corpus-based method allows retrieving sets of expression units to determine their formulaic status based on the frequency of occurrences in documents/domains collection.

in this research, the model of corpus-based statistical analysis of distribution, proposed here, adopts two query-based information retrieval methods : (i) -gram corpus maximum frequent sequences (n-gram-MFS) for the representation for weighing FEUs' formulaic status per n-gram corpus and (ii) maximum frequent sequences (D-MFS) for weighing FEUS' formulaic status per document/domain.

the use of the proposed model offers a syetematic verification tool to weigh and evaluate formulaicity status of FEUs.

American Psychological Association (APA)

Uraybi, Muhammad Abd al-Zahrah. 2022. Theoretical and methodological foundations for corpus-based analysis of formulaic expression units. lark Journal for Philosophy, linguistics and Social Sciences،Vol. 2, no. 45, pp.1151-1177.
https://search.emarefa.net/detail/BIM-1539571

Modern Language Association (MLA)

Uraybi, Muhammad Abd al-Zahrah. Theoretical and methodological foundations for corpus-based analysis of formulaic expression units. lark Journal for Philosophy, linguistics and Social Sciences Vol. 2, no. 45 (Apr. 2022), pp.1151-1177.
https://search.emarefa.net/detail/BIM-1539571

American Medical Association (AMA)

Uraybi, Muhammad Abd al-Zahrah. Theoretical and methodological foundations for corpus-based analysis of formulaic expression units. lark Journal for Philosophy, linguistics and Social Sciences. 2022. Vol. 2, no. 45, pp.1151-1177.
https://search.emarefa.net/detail/BIM-1539571

Data Type

Journal Articles

Language

English

Notes

Text in English ; abstracts in English and Arabic.

Record ID

BIM-1539571