Retrieving Arabic textual documents based on queries written in Bahraini slang language

العناوين الأخرى

استرجاع الوثائق المكتوبة باللغة العربية بناءا على استفسارات مكتوبة باللهجة البحرينية العامية

مقدم أطروحة جامعية

al-Jarrah, Ayat Amin

مشرف أطروحة جامعية

Kanan, Ghassan

الجامعة

جامعة عمان العربية

الكلية

كلية العلوم الحاسوبية و المعلوماتية

القسم الأكاديمي

قسم علم الحاسوب

دولة الجامعة

الأردن

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2019

الملخص العربي

إن لغة هذه الأيام هي ا .

اللغة العامية ليست الفصحى حيث إن اللغة العامية مستخدمة بشكل واسع من قبل الكثير من الشعوب تعتبر مملكة البحرين من البلدان التي تساهم في نشر اللغة العامية المحكية التي أصبحت لغة التجار و لغة التواصل الاجتماعي.

حيث أن استعمالها يبدأ من السيطرة على المحادثات اليومية.

إضافة إلى ذلك أن اللغة العامية تبدأ باجتياح المحادثات الرسمية و المؤتمرات العلمية لإيصال المعنى المراد.

أولا، في هذا البحث سنقوم بتطوير خوارزمية بلال أبو عطا 2015 الذي صنع تغييرا ملحوظا في استرجاع المعلومات في اللغة العربية بالاعتماد على الاستعلامات المدخلة في الخليج العربي والمكتوبة بتلك اللهجة، حيث انه يقوم بالعمل على إيجاد جذور للغة العامية في الخليج العربي و ذلك عن طريق حذف أواخر الكلمات بالاعتماد على حجم جذور الكلمات ثلاثية الأصل.

حيث أن خوارزمينه هي كانت فقط مفتاح لمساعدتي في إيجاد فكرة لتحسين عملية استرجاع المعلومات باللهجة العامية البحرينية.

ثانيا، سوف تزيد عدد قواعد البيانات لتحسين نتائج الاستعلام وأيضا في هذا البحث سنقوم بوضع قواعد وأحكام جديدة أيضا.

وأخيرا، سنطبق هذه الخوارزمية على اللغة العامية البحرينية بالإضافة إلى أنها ستزيد من مصداقية ودقة محركات البحث .

وقد كانت نتائج المستندات المتعلقة بعملية البحث جيدة جدا بنسبة دقة تقريبا 64% لعمليتي البحث باستخدام اللغة العامية واللغة العربية حيث أن هذه النتائج تشير بأن هذا النظام يدعم عملية البحث باستخدام اللغة العامية البحرينية كما إن الهدف من هذا البحث هو تطوير حقل نظام استرجاع المعلومات بالإضافة إلى أنه سوف يوفر الوقت و الجهد للباحثين في اللغة العامية البحرينية.

الملخص الإنجليزي

Nowadays language is the colloquial language not the classical one.

It is widely used in many nations.

The kingdom of Bahrain had the largest share in the spread of the colloquial language, which becomes the trader's language and the language of the social communication.

It became so popular that its usage starts dominating the daily conversations.

Furthermore, colloquial language starts penetrating the official speeches and the scientific conferences in order to clarify the intended meaning.

Firstly, In this research we will improve the algorithm of "Belal Abuata in 2015" who made a big change in retrieving the document of Arabic depending on written Gulf Arabic queries and his algorithm works to find the roots of The Gulf slang language by deleting the suffixes depending on the size of its original triple root, where Bilal Abuatta algorithm is just a key in this research that helps me to find an idea to enhance the process of information retrieval in Arabic slang language of the Gulf.

In his algorithm, he deletes all the affixes, but in this research has put some special Bahraini rules to convert queries from Slang Bahraini to a classical language.

Secondly, we will increase the number of Dataset to improve the results of this query.

Also in this research we will put a new grammars and rules.

And finally, we will apply this algorithm on the Bahraini colloquial language, also it increases the accuracy of search engines.

After making an evaluation for the system relying on the results of three main aspects recall, precision, and F-measure, we noticed that the results of precision about 0.64 for both researches slang and classical, which gives a great indication that the system supports searching in Bahraini slang language.

The purpose of this research is improve the Information Retrieval system field.

In addition, it will save the time and the effort of the researchers of the Bahraini colloquial language.

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

عدد الصفحات

61

قائمة المحتويات

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Thesis framework.

Chapter Two : Previous studies.

Chapter Three : Methodology.

Chapter Four : Experiments and results.

Chapter Five : Conclusion and future works.

References.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

al-Jarrah, Ayat Amin. (2019). Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-932336

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

al-Jarrah, Ayat Amin. Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University. (2019).
https://search.emarefa.net/detail/BIM-932336

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

al-Jarrah, Ayat Amin. (2019). Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-932336

لغة النص

الإنجليزية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-932336