استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي

العناوين الأخرى

Applying computerized word-class tagging to non vocalized Arabic texts based on morphological analysis

مقدم أطروحة جامعية

عواد، ساري محمد إسماعيل

مشرف أطروحة جامعية

الديكي، محمود
سليمان حسين مصطفى

الجامعة

جامعة آل البيت

الكلية

كلية الأمير الحسين بن عبد الله لتكنولوجيا المعلومات

القسم الأكاديمي

قسم علوم الحاسوب

دولة الجامعة

الأردن

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2005

الملخص العربي

يعد حقل اللسيتيات الحاسوبية من أوسع حقول اللسينيات التطبيقية، فهو يعنى بمعالجة اللغات الطبيعية.

تختلف اللغة العربية عن اللغات الطبيعية الأخرى بأبنيتها و تراكيبها، فهي لغة اشتقاقية و ليست إلصقية.

و قد كانت الإنجليزية من أولى اللغات التي تم معالجتها بالحاسوب.

يتركز موضوع هذه الدراسة على تصنيف الكلمة العربية غير المشكولة اعتمادا على التحليل اللفظي، حيث أن معالجة اللغة العربية أليا تمر بأربع مراحل هي : التحليل المعجمي فالصرفي فالنحوي فالدلالي، حيث تهدف هذه الدراسة إلى معرفة مدى الاعتماد على الزوائد اللفظية و الصرفية في تحديد نوع الكلمة النصية.

تنطلق الدراسة من فرضية أساسية مفادها أن البنية التركيبية للكلمة العربية داخل النص تنطوي على مضامين دلالية يمكن الاعتماد عليها لدرجة كبيرة في تحديد توعها و خصائصها الوظيفية ضمن النص العربي.

و تكمن أهمية هذه الدراسة في أهمية التحليل الصرفي لكثير من التطبيقات الحاسولية لمعالجة اللغة العربية، و هي توفر المساحة و ترفع من الكفاءة بالتقليل من استخدام المعاجم.يقوم منهج هذه الدراسة على اربعة محاور أساسية أولها : التحقق من إمكانية أن تكون الكلمة التي ننوي معالجتها تنتمي إلى مجموعة الأدوات و الضمائر في اللغة العربية.

و ثانيها : التحليل اللفظي القائم عى استخدام الزوائد النحوية على اختلاف أنواعها (كحروف العطف، و حرروف الجر و آل التعريف و غيرها مما ذكره النحاة).

و ثالثها : التحليل اللفظي القائم على استخدام الأوزان الصرفية، و فق ما تنطوي عليها من زوائد صرفية على اختلاف أشكالها فهناك أوزان خاصة بالأفعال، و أوزان خاصة بالأسماء، و أوزان خاصة بالصفات، و غيرها، و هناك أوزان مشتركة بين هذه الأنواع.

و للقيام بهذا النوع من التحليل، كان لا بد من تحديد الأوزان الصرفية و حصر الزوائد الصرفية التي تدخل فيها و حصر العلاقات القائمة بينها و بين الزوائد في التحليل حيثما كان ذلك ضروريا.

فهناك كلمات ثلاثية ورباعية، لا تتضمن اي زوائد لفظية، نحوية أو صرفية.

و بذلك كان لا بد من اللجوء إلى طول الكلمة لبيان الفئة التي يمكن أن تنتمي إليها من الأاسماء و الأفعال أو التحقق من النتائج المكعالجة اعتمادا على الزوائد اللفظية.

و قد أظهرت نتائج الدراسة أنالمنهج التحليلي الذي استخدم في هذه الدراسة قد نجح في تحديد انتماء الغالبية العظمى من المفردات إلأى فئتي الأأسماء و الأفعال.

فقد كان البرنامج قادرا على إدراك 88.46 % من الأأسماء و 84.11 % من الأأفعال، و لكن هذه النسبة تقف عند نحخديد النوع الدقيق للكلمة الأسماء أو الأفعال حيث تجح البرنامج في تحديد النوع الدقيق للمفردات لما يقارب 79 % من المفردات التي يضمها النص.

و من هنا نستنتج أن بنية الكلمة داخلل النص العربي غير كافية في بعض الحالات لتحديد نوع الكلمة.

و ذلك فلعدة أسباب، أولا الاعتماد على زوائد في الكلمة لتحديد نوعها و هي من أصل الكلمة، و كان لهذا السبب ما يقارب فيها نسبته 7.75 % من المفردات التي أخطأ البرنامج في تحديد توعها الصحيح ثانيا خلبو الكلمات من الزوائد النحوية و الصرفية التي شكلت 11.4 % من مفردات النص، فلا يوجد ما يدل في بنية هذه المفردات ما يدل على نوعها، ثالثا احتواء الكلمة على زوائد نحوية لا نحدد نوع الكلمة، فهي لا تلتصق بالأسماء و الأفعال، وجود أوزان تخلط بين نوعين من المفردات.

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

عدد الصفحات

110

قائمة المحتويات

فهرس المحتويات / الموضوعات.

الملخص / المستخلص.

الفصل الأول : موضوع الدراسة و أهدافها و أهميتها.

الفصل الثاني : الدراسات و الأعمال السابقة ذات الصلة.

الفصل الثالث : الزوائد اللفظية و مضامينها الدلالية.

الفصل الرابع : منهجية التحليل اللفظي لتصنيف الفردات.

الفصل الخامس : تطبيق المنهج و تحليل النتائج.

قائمة المراجع.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

عواد، ساري محمد إسماعيل. (2005). استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي. (أطروحة ماجستير). جامعة آل البيت, الأردن
https://search.emarefa.net/detail/BIM-310737

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

عواد، ساري محمد إسماعيل. استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي. (أطروحة ماجستير). جامعة آل البيت. (2005).
https://search.emarefa.net/detail/BIM-310737

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

عواد، ساري محمد إسماعيل. (2005). استخدام الحاسوب في تصنيف الكلمة العربية غير المشكولة داخل النص اعتمادا على التحليل اللفظي. (أطروحة ماجستير). جامعة آل البيت, الأردن
https://search.emarefa.net/detail/BIM-310737

لغة النص

العربية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-310737