Identifying informative coronavirus tweets using recurrent neural network document embedding

Other Title(s)

تصنيف الأخبار المسهبة حول وباء الكورونا المستجد عبر تويتر باستخدام تضمين الملفات النصية بواسطة خوارزمية الشبكات العصبية المتكررة

Author

Yusuf, Rami Naim Muhammad

Source

Palestine Technical University Kadoorie Research Journal

Issue

Vol. 10, Issue 1 (31 Mar. 2022), pp.93-102, 10 p.

Publisher

Palestine Technical University-Kadoorie

Publication Date

2022-03-31

Country of Publication

Palestine (West Bank)

No. of Pages

10

Main Subjects

Information Technology and Computer Science

Abstract AR

أدى ظهور جائحة كورونا إلى انتشار عدد هائل من أخبار كاذبة و معلومات مضللة عبر التغريدات، و من ثم فان هناك حاجة مهمة تتمثل في تصنيف التغريدات إلى تغريدات مسببة إعلاميا و غير مسببة إعلاميا و هذا الامر حفز الباحثين على استخدام تقنيات التعلم الآلي لمعالجة هذا الموضوع و قد أظهرت الدراسات الحديثة اعتمادا كبيرا على خوارزميات الشبكة العصبية المتحورة و مع ذلك فهي تعاني من مشكلة تدعى "النسيان الكارثي" حيث تفقد معلومات سياقية خلال عملية التدريب.

لذلك هذه الدراسة تهدف إلى اقتراح آلية لتضمين النصوص بناءا على الشبكة العصبية المتكررة أخيرا، تم استخدام ثلاثة مصنفات من LR و SVM و MLP لتصنيف المستندات إلى مسهبة إعلاميا و غير مسهبة إعلاميا، باستخدام مجموعة البيانات المعيارية ل 2020-WNUT في المهمة 2 ، حصل مصنف LR على أعلى مقياس يبلغ 0.91.

توضح هذه النتيجة فعالية RNN في توليد اليات تضمين نصوص مركبة.

Abstract EN

The coronavirus pandemic has led to the spread of tremendous fake news and misleading information through tweets.

hence, an interesting task of classifying tweets into informative and uninformative has motivated researchers to employ machine learning techniques.

the state-of-the-art studies showed high dependency on transformers architecture.

however, the transformers architecture suffers from the catastrophic forgetting problem where important contextual information is being forgotten by the gradients.

therefore, this paper proposes a document embedding using recurrent neural network.

Lastly, three classifiers of LR, SVM and MLP have been used to classify documents into informative and uninformative.

using the benchmark dataset of WNUT-2020 at Task 2, LR classifier obtained the highest f-measure of 0.91.

this result demonstrates the efficacy of RNN to generate sophisticated document embedding.

American Psychological Association (APA)

Yusuf, Rami Naim Muhammad. 2022. Identifying informative coronavirus tweets using recurrent neural network document embedding. Palestine Technical University Kadoorie Research Journal،Vol. 10, no. 1, pp.93-102.
https://search.emarefa.net/detail/BIM-1505794

Modern Language Association (MLA)

Yusuf, Rami Naim Muhammad. Identifying informative coronavirus tweets using recurrent neural network document embedding. Palestine Technical University Kadoorie Research Journal Vol. 10, no. 1 (2022), pp.93-102.
https://search.emarefa.net/detail/BIM-1505794

American Medical Association (AMA)

Yusuf, Rami Naim Muhammad. Identifying informative coronavirus tweets using recurrent neural network document embedding. Palestine Technical University Kadoorie Research Journal. 2022. Vol. 10, no. 1, pp.93-102.
https://search.emarefa.net/detail/BIM-1505794

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 101-102

Record ID

BIM-1505794