استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي

Other Title(s)

Applying computerized word-class tagging to non vocalized Arabic texts based on morphological analysis

Dissertant

عواد، ساري محمد إسماعيل

Thesis advisor

الديكي، محمود
سليمان حسين مصطفى

University

Al albayt University

Faculty

Prince Hussein Bin Abdullah Faculty for Information Technology

Department

Department of Computer Science

University Country

Jordan

Degree

Master

Degree Date

2005

Arabic Abstract

يعد حقل اللسيتيات الحاسوبية من أوسع حقول اللسينيات التطبيقية، فهو يعنى بمعالجة اللغات الطبيعية.

تختلف اللغة العربية عن اللغات الطبيعية الأخرى بأبنيتها و تراكيبها، فهي لغة اشتقاقية و ليست إلصقية.

و قد كانت الإنجليزية من أولى اللغات التي تم معالجتها بالحاسوب.

يتركز موضوع هذه الدراسة على تصنيف الكلمة العربية غير المشكولة اعتمادا على التحليل اللفظي، حيث أن معالجة اللغة العربية أليا تمر بأربع مراحل هي : التحليل المعجمي فالصرفي فالنحوي فالدلالي، حيث تهدف هذه الدراسة إلى معرفة مدى الاعتماد على الزوائد اللفظية و الصرفية في تحديد نوع الكلمة النصية.

تنطلق الدراسة من فرضية أساسية مفادها أن البنية التركيبية للكلمة العربية داخل النص تنطوي على مضامين دلالية يمكن الاعتماد عليها لدرجة كبيرة في تحديد توعها و خصائصها الوظيفية ضمن النص العربي.

و تكمن أهمية هذه الدراسة في أهمية التحليل الصرفي لكثير من التطبيقات الحاسولية لمعالجة اللغة العربية، و هي توفر المساحة و ترفع من الكفاءة بالتقليل من استخدام المعاجم.يقوم منهج هذه الدراسة على اربعة محاور أساسية أولها : التحقق من إمكانية أن تكون الكلمة التي ننوي معالجتها تنتمي إلى مجموعة الأدوات و الضمائر في اللغة العربية.

و ثانيها : التحليل اللفظي القائم عى استخدام الزوائد النحوية على اختلاف أنواعها (كحروف العطف، و حرروف الجر و آل التعريف و غيرها مما ذكره النحاة).

و ثالثها : التحليل اللفظي القائم على استخدام الأوزان الصرفية، و فق ما تنطوي عليها من زوائد صرفية على اختلاف أشكالها فهناك أوزان خاصة بالأفعال، و أوزان خاصة بالأسماء، و أوزان خاصة بالصفات، و غيرها، و هناك أوزان مشتركة بين هذه الأنواع.

و للقيام بهذا النوع من التحليل، كان لا بد من تحديد الأوزان الصرفية و حصر الزوائد الصرفية التي تدخل فيها و حصر العلاقات القائمة بينها و بين الزوائد في التحليل حيثما كان ذلك ضروريا.

فهناك كلمات ثلاثية ورباعية، لا تتضمن اي زوائد لفظية، نحوية أو صرفية.

و بذلك كان لا بد من اللجوء إلى طول الكلمة لبيان الفئة التي يمكن أن تنتمي إليها من الأاسماء و الأفعال أو التحقق من النتائج المكعالجة اعتمادا على الزوائد اللفظية.

و قد أظهرت نتائج الدراسة أنالمنهج التحليلي الذي استخدم في هذه الدراسة قد نجح في تحديد انتماء الغالبية العظمى من المفردات إلأى فئتي الأأسماء و الأفعال.

فقد كان البرنامج قادرا على إدراك 88.46 % من الأأسماء و 84.11 % من الأأفعال، و لكن هذه النسبة تقف عند نحخديد النوع الدقيق للكلمة الأسماء أو الأفعال حيث تجح البرنامج في تحديد النوع الدقيق للمفردات لما يقارب 79 % من المفردات التي يضمها النص.

و من هنا نستنتج أن بنية الكلمة داخلل النص العربي غير كافية في بعض الحالات لتحديد نوع الكلمة.

و ذلك فلعدة أسباب، أولا الاعتماد على زوائد في الكلمة لتحديد نوعها و هي من أصل الكلمة، و كان لهذا السبب ما يقارب فيها نسبته 7.75 % من المفردات التي أخطأ البرنامج في تحديد توعها الصحيح ثانيا خلبو الكلمات من الزوائد النحوية و الصرفية التي شكلت 11.4 % من مفردات النص، فلا يوجد ما يدل في بنية هذه المفردات ما يدل على نوعها، ثالثا احتواء الكلمة على زوائد نحوية لا نحدد نوع الكلمة، فهي لا تلتصق بالأسماء و الأفعال، وجود أوزان تخلط بين نوعين من المفردات.

Main Subjects

Information Technology and Computer Science

Topics

No. of Pages

110

Table of Contents

فهرس المحتويات / الموضوعات.

الملخص / المستخلص.

الفصل الأول : موضوع الدراسة و أهدافها و أهميتها.

الفصل الثاني : الدراسات و الأعمال السابقة ذات الصلة.

الفصل الثالث : الزوائد اللفظية و مضامينها الدلالية.

الفصل الرابع : منهجية التحليل اللفظي لتصنيف الفردات.

الفصل الخامس : تطبيق المنهج و تحليل النتائج.

قائمة المراجع.

American Psychological Association (APA)

عواد، ساري محمد إسماعيل. (2005). استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي. (أطروحة ماجستير). جامعة آل البيت, الأردن
https://search.emarefa.net/detail/BIM-310737

Modern Language Association (MLA)

عواد، ساري محمد إسماعيل. استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي. (أطروحة ماجستير). جامعة آل البيت. (2005).
https://search.emarefa.net/detail/BIM-310737

American Medical Association (AMA)

عواد، ساري محمد إسماعيل. (2005). استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي. (أطروحة ماجستير). جامعة آل البيت, الأردن
https://search.emarefa.net/detail/BIM-310737

Language

Arabic

Data Type

Arab Theses

Record ID

BIM-310737