Retrieving Arabic textual documents based on queries written in Bahraini slang language
Other Title(s)
استرجاع الوثائق المكتوبة باللغة العربية بناءا على استفسارات مكتوبة باللهجة البحرينية العامية
Dissertant
Thesis advisor
University
Amman Arab University
Faculty
Collage of Computer Sciences and Informatics
Department
Department of Computer Science
University Country
Jordan
Degree
Master
Degree Date
2019
Arabic Abstract
إن لغة هذه الأيام هي ا .
اللغة العامية ليست الفصحى حيث إن اللغة العامية مستخدمة بشكل واسع من قبل الكثير من الشعوب تعتبر مملكة البحرين من البلدان التي تساهم في نشر اللغة العامية المحكية التي أصبحت لغة التجار و لغة التواصل الاجتماعي.
حيث أن استعمالها يبدأ من السيطرة على المحادثات اليومية.
إضافة إلى ذلك أن اللغة العامية تبدأ باجتياح المحادثات الرسمية و المؤتمرات العلمية لإيصال المعنى المراد.
أولا، في هذا البحث سنقوم بتطوير خوارزمية بلال أبو عطا 2015 الذي صنع تغييرا ملحوظا في استرجاع المعلومات في اللغة العربية بالاعتماد على الاستعلامات المدخلة في الخليج العربي والمكتوبة بتلك اللهجة، حيث انه يقوم بالعمل على إيجاد جذور للغة العامية في الخليج العربي و ذلك عن طريق حذف أواخر الكلمات بالاعتماد على حجم جذور الكلمات ثلاثية الأصل.
حيث أن خوارزمينه هي كانت فقط مفتاح لمساعدتي في إيجاد فكرة لتحسين عملية استرجاع المعلومات باللهجة العامية البحرينية.
ثانيا، سوف تزيد عدد قواعد البيانات لتحسين نتائج الاستعلام وأيضا في هذا البحث سنقوم بوضع قواعد وأحكام جديدة أيضا.
وأخيرا، سنطبق هذه الخوارزمية على اللغة العامية البحرينية بالإضافة إلى أنها ستزيد من مصداقية ودقة محركات البحث .
وقد كانت نتائج المستندات المتعلقة بعملية البحث جيدة جدا بنسبة دقة تقريبا 64% لعمليتي البحث باستخدام اللغة العامية واللغة العربية حيث أن هذه النتائج تشير بأن هذا النظام يدعم عملية البحث باستخدام اللغة العامية البحرينية كما إن الهدف من هذا البحث هو تطوير حقل نظام استرجاع المعلومات بالإضافة إلى أنه سوف يوفر الوقت و الجهد للباحثين في اللغة العامية البحرينية.
English Abstract
Nowadays language is the colloquial language not the classical one.
It is widely used in many nations.
The kingdom of Bahrain had the largest share in the spread of the colloquial language, which becomes the trader's language and the language of the social communication.
It became so popular that its usage starts dominating the daily conversations.
Furthermore, colloquial language starts penetrating the official speeches and the scientific conferences in order to clarify the intended meaning.
Firstly, In this research we will improve the algorithm of "Belal Abuata in 2015" who made a big change in retrieving the document of Arabic depending on written Gulf Arabic queries and his algorithm works to find the roots of The Gulf slang language by deleting the suffixes depending on the size of its original triple root, where Bilal Abuatta algorithm is just a key in this research that helps me to find an idea to enhance the process of information retrieval in Arabic slang language of the Gulf.
In his algorithm, he deletes all the affixes, but in this research has put some special Bahraini rules to convert queries from Slang Bahraini to a classical language.
Secondly, we will increase the number of Dataset to improve the results of this query.
Also in this research we will put a new grammars and rules.
And finally, we will apply this algorithm on the Bahraini colloquial language, also it increases the accuracy of search engines.
After making an evaluation for the system relying on the results of three main aspects recall, precision, and F-measure, we noticed that the results of precision about 0.64 for both researches slang and classical, which gives a great indication that the system supports searching in Bahraini slang language.
The purpose of this research is improve the Information Retrieval system field.
In addition, it will save the time and the effort of the researchers of the Bahraini colloquial language.
Main Subjects
Information Technology and Computer Science
Topics
No. of Pages
61
Table of Contents
Table of contents.
Abstract.
Abstract in Arabic.
Chapter One : Thesis framework.
Chapter Two : Previous studies.
Chapter Three : Methodology.
Chapter Four : Experiments and results.
Chapter Five : Conclusion and future works.
References.
American Psychological Association (APA)
al-Jarrah, Ayat Amin. (2019). Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-932336
Modern Language Association (MLA)
al-Jarrah, Ayat Amin. Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University. (2019).
https://search.emarefa.net/detail/BIM-932336
American Medical Association (AMA)
al-Jarrah, Ayat Amin. (2019). Retrieving Arabic textual documents based on queries written in Bahraini slang language. (Master's theses Theses and Dissertations Master). Amman Arab University, Jordan
https://search.emarefa.net/detail/BIM-932336
Language
English
Data Type
Arab Theses
Record ID
BIM-932336