Extracting Arabic text summarization on social media for trending topics
Dissertant
Thesis advisor
University
Philadelphia University
Faculty
Faculty of Information Technology
Department
Department of Computer Science
University Country
Jordan
Degree
Master
Degree Date
2019
Arabic Abstract
يعد تلخيص النص تلقائيا أحد أهم التحديات في علم الحاسوب و معالجة اللغة الطبيعية يهدف هذا البحث إلى بناء نظام تلخيص ديناميكي من خلال وسائل التواصل الاجتماعي باستخدام تويتر.
الهدف من النظام المقترح هو استخراج ملخصات من المواضيع المثيرة للاهتمام المستخدمي تويتر باستخدام التغريدات الحديثة، حيث سيتم ربط الطرق المقترحة مباشرة مع تويتر باستخدام واجهة برمجة تطبيقات تويتر سيكون النظام المقترح مزيجا يستخدم كل من خوارزمية توزيع المضامين ( LDA ) و أساليب المقاطع النصية ( N-Gram ) ، حيث سيتم استخدام خوارزمية توزيع المضامين لاستخراج أهم الكلمات الرئيسية من مجموعة البيانات المجمعة من خاتل حساب تكرار الكلمات في كل موضوع بينما سيتم استخدام المقاطع النصية لإيجاد أفضل ترتيب للكلمات في الموضوع المقترح أنتج نظامنا المقترح أفضل النتائج مقارنة بتقنيات التلخيص الأخرى.
بشكل عام، و من خلال استخدام مقياس ROUGE لتقييم النتائج حيث حصل النظام المقترح على نتيجة 65 = F-measure تبين أن النظام المقترح يحقق مستوى جيدا من أداء التلخيص مقارنة بالتلخيص البدوي.
English Abstract
Automatic text summarization (ATS) is one of the most important challenges in the computer science and Natural Language Processing (NLP).
In this research we aim to build a dynamic summarization approach on social media using twitter.
The aim of the proposed approach is to extract summarizations from the interesting topics for twitter' users using recent tweets, where the proposed approach will be connected directly with twitter using twitter' API.
The proposed approach will be hybrid using each of Latent Dirichlet Allocation (LDA) algorithm and N-gram, where LDA algorithm will be used to extract the most important keywords from collected dataset through calculating the frequencies for words in each topic.
While N-gram will be used to find the best ordering for words in the suggested topic.
The proposed system produced best results compared to other summarization techniques.
Generally, ROUGE evolution metric (F-measure) = 65% which indicate that the proposed system achieves good level of summarization performance compared to the manual summarization.
Main Subjects
Information Technology and Computer Science
Topics
No. of Pages
52
Table of Contents
Table of contents.
Abstract.
Abstract in Arabic.
Chapter One : Introduction.
Chapter Two : Related works.
Chapter Three : Research methodolgy.
Chapter Four : Implementation.
Chapter Five : Results analysis.
Chapter Six : Conclusions and future works.
References.
American Psychological Association (APA)
Malkawi, Ala Salim. (2019). Extracting Arabic text summarization on social media for trending topics. (Master's theses Theses and Dissertations Master). Philadelphia University, Jordan
https://search.emarefa.net/detail/BIM-955253
Modern Language Association (MLA)
Malkawi, Ala Salim. Extracting Arabic text summarization on social media for trending topics. (Master's theses Theses and Dissertations Master). Philadelphia University. (2019).
https://search.emarefa.net/detail/BIM-955253
American Medical Association (AMA)
Malkawi, Ala Salim. (2019). Extracting Arabic text summarization on social media for trending topics. (Master's theses Theses and Dissertations Master). Philadelphia University, Jordan
https://search.emarefa.net/detail/BIM-955253
Language
English
Data Type
Arab Theses
Record ID
BIM-955253