Retrieving Arabic textual documents based on queries written in Bahraini slang language

Other Title(s)

استرجاع الوثائق المكتوبة باللغة العربية بناءا على استفسارات مكتوبة باللهجة البحرينية العامية

Dissertant

al-Jarrah, Ayat Amin

Thesis advisor

Kanan, Ghassan

University

Amman Arab University

Faculty

Collage of Computer Sciences and Informatics

Department

Department of Computer Science

University Country

Jordan

Degree

Master

Degree Date

2019

Arabic Abstract

إن لغة هذه الأيام هي ا .

اللغة العامية ليست الفصحى حيث إن اللغة العامية مستخدمة بشكل واسع من قبل الكثير من الشعوب تعتبر مملكة البحرين من البلدان التي تساهم في نشر اللغة العامية المحكية التي أصبحت لغة التجار و لغة التواصل الاجتماعي.

حيث أن استعمالها يبدأ من السيطرة على المحادثات اليومية.

إضافة إلى ذلك أن اللغة العامية تبدأ باجتياح المحادثات الرسمية و المؤتمرات العلمية لإيصال المعنى المراد.

أولا، في هذا البحث سنقوم بتطوير خوارزمية بلال أبو عطا 2015 الذي صنع تغييرا ملحوظا في استرجاع المعلومات في اللغة العربية بالاعتماد على الاستعلامات المدخلة في الخليج العربي والمكتوبة بتلك اللهجة، حيث انه يقوم بالعمل على إيجاد جذور للغة العامية في الخليج العربي و ذلك عن طريق حذف أواخر الكلمات بالاعتماد على حجم جذور الكلمات ثلاثية الأصل.

حيث أن خوارزمينه هي كانت فقط مفتاح لمساعدتي في إيجاد فكرة لتحسين عملية استرجاع المعلومات باللهجة العامية البحرينية.

ثانيا، سوف تزيد عدد قواعد البيانات لتحسين نتائج الاستعلام وأيضا في هذا البحث سنقوم بوضع قواعد وأحكام جديدة أيضا.

وأخيرا، سنطبق هذه الخوارزمية على اللغة العامية البحرينية بالإضافة إلى أنها ستزيد من مصداقية ودقة محركات البحث .

وقد كانت نتائج المستندات المتعلقة بعملية البحث جيدة جدا بنسبة دقة تقريبا 64% لعمليتي البحث باستخدام اللغة العامية واللغة العربية حيث أن هذه النتائج تشير بأن هذا النظام يدعم عملية البحث باستخدام اللغة العامية البحرينية كما إن الهدف من هذا البحث هو تطوير حقل نظام استرجاع المعلومات بالإضافة إلى أنه سوف يوفر الوقت و الجهد للباحثين في اللغة العامية البحرينية.

English Abstract

Nowadays language is the colloquial language not the classical one.

It is widely used in many nations.

The kingdom of Bahrain had the largest share in the spread of the colloquial language, which becomes the trader's language and the language of the social communication.

It became so popular that its usage starts dominating the daily conversations.

Furthermore, colloquial language starts penetrating the official speeches and the scientific conferences in order to clarify the intended meaning.

Firstly, In this research we will improve the algorithm of "Belal Abuata in 2015" who made a big change in retrieving the document of Arabic depending on written Gulf Arabic queries and his algorithm works to find the roots of The Gulf slang language by deleting the suffixes depending on the size of its original triple root, where Bilal Abuatta algorithm is just a key in this research that helps me to find an idea to enhance the process of information retrieval in Arabic slang language of the Gulf.

In his algorithm, he deletes all the affixes, but in this research has put some special Bahraini rules to convert queries from Slang Bahraini to a classical language.

Secondly, we will increase the number of Dataset to improve the results of this query.

Also in this research we will put a new grammars and rules.

And finally, we will apply this algorithm on the Bahraini colloquial language, also it increases the accuracy of search engines.

After making an evaluation for the system relying on the results of three main aspects recall, precision, and F-measure, we noticed that the results of precision about 0.64 for both researches slang and classical, which gives a great indication that the system supports searching in Bahraini slang language.

The purpose of this research is improve the Information Retrieval system field.

In addition, it will save the time and the effort of the researchers of the Bahraini colloquial language.

Main Subjects

Information Technology and Computer Science

Topics

No. of Pages

61

Table of Contents

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Thesis framework.

Chapter Two : Previous studies.

Chapter Three : Methodology.

Chapter Four : Experiments and results.

Chapter Five : Conclusion and future works.

References.

American Psychological Association (APA)

al-Jarrah, Ayat Amin. (2019). Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-932336

Modern Language Association (MLA)

al-Jarrah, Ayat Amin. Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University. (2019).
https://search.emarefa.net/detail/BIM-932336

American Medical Association (AMA)

al-Jarrah, Ayat Amin. (2019). Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-932336

Language

English

Data Type

Arab Theses

Record ID

BIM-932336