Extracting Arabic text summarization on social media for trending topics

Dissertant

Malkawi, Ala Salim

Thesis advisor

al-Athami, Muayyad A. Fadil

University

Philadelphia University

Faculty

Faculty of Information Technology

Department

Department of Computer Science

University Country

Jordan

Degree

Master

Degree Date

2019

Arabic Abstract

يعد تلخيص النص تلقائيا أحد أهم التحديات في علم الحاسوب و معالجة اللغة الطبيعية يهدف هذا البحث إلى بناء نظام تلخيص ديناميكي من خلال وسائل التواصل الاجتماعي باستخدام تويتر.

الهدف من النظام المقترح هو استخراج ملخصات من المواضيع المثيرة للاهتمام المستخدمي تويتر باستخدام التغريدات الحديثة، حيث سيتم ربط الطرق المقترحة مباشرة مع تويتر باستخدام واجهة برمجة تطبيقات تويتر سيكون النظام المقترح مزيجا يستخدم كل من خوارزمية توزيع المضامين ( LDA ) و أساليب المقاطع النصية ( N-Gram ) ، حيث سيتم استخدام خوارزمية توزيع المضامين لاستخراج أهم الكلمات الرئيسية من مجموعة البيانات المجمعة من خاتل حساب تكرار الكلمات في كل موضوع بينما سيتم استخدام المقاطع النصية لإيجاد أفضل ترتيب للكلمات في الموضوع المقترح أنتج نظامنا المقترح أفضل النتائج مقارنة بتقنيات التلخيص الأخرى.

بشكل عام، و من خلال استخدام مقياس ROUGE لتقييم النتائج حيث حصل النظام المقترح على نتيجة 65 = F-measure تبين أن النظام المقترح يحقق مستوى جيدا من أداء التلخيص مقارنة بالتلخيص البدوي.

English Abstract

Automatic text summarization (ATS) is one of the most important challenges in the computer science and Natural Language Processing (NLP).

In this research we aim to build a dynamic summarization approach on social media using twitter.

The aim of the proposed approach is to extract summarizations from the interesting topics for twitter' users using recent tweets, where the proposed approach will be connected directly with twitter using twitter' API.

The proposed approach will be hybrid using each of Latent Dirichlet Allocation (LDA) algorithm and N-gram, where LDA algorithm will be used to extract the most important keywords from collected dataset through calculating the frequencies for words in each topic.

While N-gram will be used to find the best ordering for words in the suggested topic.

The proposed system produced best results compared to other summarization techniques.

Generally, ROUGE evolution metric (F-measure) = 65% which indicate that the proposed system achieves good level of summarization performance compared to the manual summarization.

Main Subjects

Information Technology and Computer Science

Topics

No. of Pages

52

Table of Contents

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Related works.

Chapter Three : Research methodolgy.

Chapter Four : Implementation.

Chapter Five : Results analysis.

Chapter Six : Conclusions and future works.

References.

American Psychological Association (APA)

Malkawi, Ala Salim. (2019). Extracting Arabic text summarization on social media for trending topics. (Master's theses Theses and Dissertations Master). Philadelphia University, Jordan
https://search.emarefa.net/detail/BIM-955253

Modern Language Association (MLA)

Malkawi, Ala Salim. Extracting Arabic text summarization on social media for trending topics. (Master's theses Theses and Dissertations Master). Philadelphia University. (2019).
https://search.emarefa.net/detail/BIM-955253

American Medical Association (AMA)

Malkawi, Ala Salim. (2019). Extracting Arabic text summarization on social media for trending topics. (Master's theses Theses and Dissertations Master). Philadelphia University, Jordan
https://search.emarefa.net/detail/BIM-955253

Language

English

Data Type

Arab Theses

Record ID

BIM-955253