Detecting and classifying software bugs and requirements in Arabic mobile app reviews

العناوين الأخرى

اكتشاف و تحليل متطلبات البرمجيات و أخطائها في تطبيقات الهواتف الذكية باللعة العربية

مقدم أطروحة جامعية

Mustafa, Qutaybah

مشرف أطروحة جامعية

Jarrar, Mustafa

الجامعة

جامعة بيرزيت

الكلية

كلية الهندسة و التكنولوجيا

القسم الأكاديمي

دائرة هندسة أنظمة الحاسوب

دولة الجامعة

فلسطين (الضفة الغربية)

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2021

الملخص العربي

جمع متطلبات البرمجيات عادة ما يتضمن إشراك مستخدمي هذه التطبيقات لأخذ تغذيتهم الراجعة ليتم تعديل و تطوير هذه التطبيقات بما يتناسب مع احتياجات مستخدميها.

قديما، كان يتم جمع تغذية المستخدمين الراجعة من خلال إجراء مقابلات مع المستخدمين أو من خلال عقد حلقات نقاش و تفكير.

و مع النمو الكبير في تطوير تطبيقات الهواتف الذكية و ازدياد أعداد مستخدمي هذه التطبيقات بشكل هائل فقد أصبح من الصعب استخدام الطرق التقليدية لجمع احتياجات المستخدمين و أخذ تغذيتهم الراجعة بالحسبان، فقد توجه مطورو هذه التطبيقات إلى استخدام أنظمة جمع التغذية الراجعة من المستخدمين، و مع العدد الكبير في أعداد المستخدمين و تنوع لغاتهم و لهجاتهم فإنه من الصعب على مطوري التطبيقات مراجعة و تحليل الأعداد الكبيرة من تغذية المستخدمين الراجعة من خلال هذه الأنظمة.

تعد متاجر التطبيقات أحد أشهر أنظمة جمع تغذية المستخدمين الراجعة لتطبيقات الهواتف الذكية، حيث يستطيع مستخدمو التطبيقات من خلال هذه المتاجر تقديم تغذيتهم الرجعة لمطوري التطبيق و المستخدمين الآخرين بعدة أشكال منها : تقييم التطبيق بعدد من النجوم، إبداء إعجابهم بهذا التطبيق أو عدمه أو من خلال كتابة تغذيتهم الراجعة على شكل نص بلغتهم.

و قد وجدت بعض الدراسات الحديثة أن تغذية المستخدمين النصية على متاجر التطبيقات قد تحتوي على العديد من المعلومات المفيدة لمطوري هذه التطبيقات، فقد يشير المستخدمون من خلال هذه النصوص إلى أخطاء في التطبيق أو اقتراحات و أفكار وظيفية أو غير وظيفية لتطوير التطبيق.

و في هذا البحث العلمي، أعتزم استخدام تقنيات الذكاء الصناعي و أنظمة الشبكات العصبونية المدربة لبناء أداة تقوم بتحليل الأعداد الهائلة من تغذية المستخدمين الراجعة النصية المكتوبة باللغة العربية بشكل آلي و تصنيفها إلى خمس فئات رئيسة الأخطاء البرمجية متطلبات المستخدمين، متطلبات المستخدمين غير الوظيفية، النصوص العامة التي لا تحتوي أي معلومات مفيدة، النصوص التي قد تحتوي معلومات مفيدة، و لكنها غير واضحة وتحتاج الى التواصل مع المستخدمين لفهمها.

لقد قمت بجمع مدونة نصية تحتوي على حوالي عشرة الاف تغذية راجعة من 5 تطبيقات مختلفة و قمت بتصنيف هذه النصوص إلى ٣٣ فئة محددة.

و قمت بعد ذلك بضبط نظام بيرت للتعلم العميق لكي يستطيع فهم و تصنيف التغذيات الراجعة بطريقة آلية لقد قمت بإجراء ٣ تجارب مختلفة على المدونة النصية حيث ان التجربة الأولى كانت باستخدام ال ٣٣ فئة، اما في التجربة الثانية فقد قمت بتصنيف المدونة النصية الى ٥ فئات محددة، و الى ٣ فئات أخرى في التجربة الثالثة، و حصلت بذلك على دقة وصلت الى ٩٩ و ٩٤٪ و ٩٥٪ في الثلاث تجارب.

الملخص الإنجليزي

Collecting software requirements typically involve users through interviews, focus groups, and workshops.

Recently, software operators started to collect software requirements, users' feedback, and bug reports from reviews and feedback systems.

However, The users usually do not pay attention to review applications after downloading them, and regular users may not know how to report bugs to the software operator, and they might write many useless reviews.

Application distributed systems (known as App stores) allows users to submit their reviews on the app they downloaded in several forms: score rating, like or dislike, and text reviews.

Recent studies show that the text reviews could include informative information for the app developers, such as potential software bugs, user requirements, sentiments about the application, or some ideas for improvements.

In this thesis, I propose an automatic method to analyze and classify user text reviews into five main classes: Software bugs, Software users' requirements, Nonfunctional software requirements, not clear ( which includes all the reviews that I think it is informative for the app stockholders) and not relevant.

I built a corpus of about 10k Arabic reviews collected from 5 different applications and classified them into 33 classes.

Then, I fine-tuned an Arabic pre-trained BERT model (stateof-the-art Deep learning architecture for NLP) using the corpus and conducted three experiments on three different versions of the dataset where two versions were generated by grouping the original 33 classes into five classes and three classes.

The model achieved 99%, 94%, 95% accuracy in the three different experiments.

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

عدد الصفحات

97

قائمة المحتويات

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Background.

Chapter Three : Related work.

Chapter Four : Data collection and analysis.

Chapter Five : Research methodology and experimental setup.

Chapter Six : Experiments results and analysis.

Chapter Seven : Conclusion.

References.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Mustafa, Qutaybah. (2021). Detecting and classifying software bugs and requirements in Arabic mobile app reviews. (Master's theses Theses and Dissertations Master). Birzeit University, Palestine (West Bank)
https://search.emarefa.net/detail/BIM-1412379

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Mustafa, Qutaybah. Detecting and classifying software bugs and requirements in Arabic mobile app reviews. (Master's theses Theses and Dissertations Master). Birzeit University. (2021).
https://search.emarefa.net/detail/BIM-1412379

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Mustafa, Qutaybah. (2021). Detecting and classifying software bugs and requirements in Arabic mobile app reviews. (Master's theses Theses and Dissertations Master). Birzeit University, Palestine (West Bank)
https://search.emarefa.net/detail/BIM-1412379

لغة النص

الإنجليزية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-1412379