بناء مكنز آلي لتعزيز نظام استرجاع المعلومات للغة العربية

العناوين الأخرى

Constructing an automatic thesaurus to enhance Arabic information retrieval system

مقدم أطروحة جامعية

الوديان، محمد عمر محمد

مشرف أطروحة جامعية

عبابنة، إسماعيل محمد
كنعان، غسان

أعضاء اللجنة

ربابعة، مأمون سليمان
حمارشة، أكرم

الجامعة

جامعة آل البيت

الكلية

كلية الأمير الحسين بن عبد الله لتكنولوجيا المعلومات

القسم الأكاديمي

قسم علوم الحاسوب

دولة الجامعة

الأردن

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2005

الملخص العربي

بعد أن وصل حجم المعلومات و الوثائق حدا لا يمكن إحصاءه، و زدات معه تعقيدات عمليات البحث سواء في الإنترنت أو في المكتبات، فإن اضرورة تقتضي إيجاد وسائل مساعدة في عملية البحث و التحسين عليه، فالأبخاث في هذا الموضوع غزيرة في اللغات الإنجليزية و الأوروبية، إلا أن الجهود في مجال اللغة العربية ما زالت محدودة.

تقوم هذه الدراسة على تطبيق آلية بناء المكنز في اللغات الأخرى لا سيما الإنجليزية على اللغة العربية، و معرفة مدى ملائمة ذلك في نظم استرجاع لمعلومات للغة العربية، حيث تقوم هذه الآليات في نظم استرجاع المعلومات على تحليل المستند بطريقة إحصائية من حلال المعدلات يتم إعطاء التعبير وزن، و حساب و درجة التشابه بين التعابير.

فعند الاستلام بواسطة تعبير معين يتم توسعة الاستعلام بواسطة التعابير الأخرى ذات التشابه الكبير مع التعابير المستخدمة في الاستعلام باستخدام الكلمة كاملة تارة، و باستخدام جذر الكلمة تارة أخرى.

تمت في هذه الدراسة برمجة جميع المعادلات اللازمة لتحليل المستندات و حساب الأوزان و بناء المكنز، و تبين النتائج أن النظام الذي يستخدم المكنز يعطي نتائج أفضل كما في اللغات الأخرى، و إن استخدام جذور الكلمات يعطي نتائج أفضل من استخدام الكلمة كاملة سواء في النظام التقليدي أو عند استخدام الجذور في بناء المكنز. بعد أن وصل حجم المعلومات و الوثائق حدا لا يمكن إحصاءه، و زدات معه تعقيدات عمليات البحث سواء في الإنترنت أو في المكتبات، فإن اضرورة تقتضي إيجاد وسائل مساعدة في عملية البحث و التحسين عليه، فالأبخاث في هذا الموضوع غزيرة في اللغات الإنجليزية و الأوروبية، إلا أن الجهود في مجال اللغة العربية ما زالت محدودة.

تقوم هذه الدراسة على تطبيق آلية بناء المكنز في اللغات الأخرى لا سيما الإنجليزية على اللغة العربية، و معرفة مدى ملائمة ذلك في نظم استرجاع لمعلومات للغة العربية، حيث تقوم هذه الآليات في نظم استرجاع المعلومات على تحليل المستند بطريقة إحصائية من حلال المعدلات يتم إعطاء التعبير وزن، و حساب و درجة التشابه بين التعابير.

فعند الاستلام بواسطة تعبير معين يتم توسعة الاستعلام بواسطة التعابير الأخرى ذات التشابه الكبير مع التعابير المستخدمة في الاستعلام باستخدام الكلمة كاملة تارة، و باستخدام جذر الكلمة تارة أخرى.

تمت في هذه الدراسة برمجة جميع المعادلات اللازمة لتحليل المستندات و حساب الأوزان و بناء المكنز، و تبين النتائج أن النظام الذي يستخدم المكنز يعطي نتائج أفضل كما في اللغات الأخرى، و إن استخدام جذور الكلمات يعطي نتائج أفضل من استخدام الكلمة كاملة سواء في النظام التقليدي أو عند استخدام الجذور في بناء المكنز.

التخصصات الرئيسية

علم المكتبات والمعلومات

الموضوعات

عدد الصفحات

94

قائمة المحتويات

فهرس المحتويات / الموضوعات.

الملخص / المستخلص.

الفصل الأول : مقدمة الدراسة.

الفصل الثاني : اللغة العربية.

الفصل الثالث : التكشيف.

الفصل الرابع : نماذج و طرق تقييم نظم استرجاع المعلومات.

الفصل الخامس : المكنز.

الفصل السادس : الدراسات السابقة.

الفصل السابع : النظام المقترح.

الفصل الثامن : برمجة النظام المقترح و واجهته.

الفصل التاسع : النتائج و الأعمال المستقبلية.

قائمة المراجع.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

الوديان، محمد عمر محمد. (2005). بناء مكنز آلي لتعزيز نظام استرجاع المعلومات للغة العربية. (أطروحة ماجستير). جامعة آل البيت, الأردن
https://search.emarefa.net/detail/BIM-319456

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

الوديان، محمد عمر محمد. بناء مكنز آلي لتعزيز نظام استرجاع المعلومات للغة العربية. (أطروحة ماجستير). جامعة آل البيت. (2005).
https://search.emarefa.net/detail/BIM-319456

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

الوديان، محمد عمر محمد. (2005). بناء مكنز آلي لتعزيز نظام استرجاع المعلومات للغة العربية. (أطروحة ماجستير). جامعة آل البيت, الأردن
https://search.emarefa.net/detail/BIM-319456

لغة النص

العربية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-319456