Identifying informative coronavirus tweets using recurrent neural network document embedding
Other Title(s)
تصنيف الأخبار المسهبة حول وباء الكورونا المستجد عبر تويتر باستخدام تضمين الملفات النصية بواسطة خوارزمية الشبكات العصبية المتكررة
Author
Source
Palestine Technical University Kadoorie Research Journal
Issue
Vol. 10, Issue 1 (31 Mar. 2022), pp.93-102, 10 p.
Publisher
Palestine Technical University-Kadoorie
Publication Date
2022-03-31
Country of Publication
Palestine (West Bank)
No. of Pages
10
Main Subjects
Information Technology and Computer Science
Abstract AR
أدى ظهور جائحة كورونا إلى انتشار عدد هائل من أخبار كاذبة و معلومات مضللة عبر التغريدات، و من ثم فان هناك حاجة مهمة تتمثل في تصنيف التغريدات إلى تغريدات مسببة إعلاميا و غير مسببة إعلاميا و هذا الامر حفز الباحثين على استخدام تقنيات التعلم الآلي لمعالجة هذا الموضوع و قد أظهرت الدراسات الحديثة اعتمادا كبيرا على خوارزميات الشبكة العصبية المتحورة و مع ذلك فهي تعاني من مشكلة تدعى "النسيان الكارثي" حيث تفقد معلومات سياقية خلال عملية التدريب.
لذلك هذه الدراسة تهدف إلى اقتراح آلية لتضمين النصوص بناءا على الشبكة العصبية المتكررة أخيرا، تم استخدام ثلاثة مصنفات من LR و SVM و MLP لتصنيف المستندات إلى مسهبة إعلاميا و غير مسهبة إعلاميا، باستخدام مجموعة البيانات المعيارية ل 2020-WNUT في المهمة 2 ، حصل مصنف LR على أعلى مقياس يبلغ 0.91.
توضح هذه النتيجة فعالية RNN في توليد اليات تضمين نصوص مركبة.
Abstract EN
The coronavirus pandemic has led to the spread of tremendous fake news and misleading information through tweets.
hence, an interesting task of classifying tweets into informative and uninformative has motivated researchers to employ machine learning techniques.
the state-of-the-art studies showed high dependency on transformers architecture.
however, the transformers architecture suffers from the catastrophic forgetting problem where important contextual information is being forgotten by the gradients.
therefore, this paper proposes a document embedding using recurrent neural network.
Lastly, three classifiers of LR, SVM and MLP have been used to classify documents into informative and uninformative.
using the benchmark dataset of WNUT-2020 at Task 2, LR classifier obtained the highest f-measure of 0.91.
this result demonstrates the efficacy of RNN to generate sophisticated document embedding.
American Psychological Association (APA)
Yusuf, Rami Naim Muhammad. 2022. Identifying informative coronavirus tweets using recurrent neural network document embedding. Palestine Technical University Kadoorie Research Journal،Vol. 10, no. 1, pp.93-102.
https://search.emarefa.net/detail/BIM-1505794
Modern Language Association (MLA)
Yusuf, Rami Naim Muhammad. Identifying informative coronavirus tweets using recurrent neural network document embedding. Palestine Technical University Kadoorie Research Journal Vol. 10, no. 1 (2022), pp.93-102.
https://search.emarefa.net/detail/BIM-1505794
American Medical Association (AMA)
Yusuf, Rami Naim Muhammad. Identifying informative coronavirus tweets using recurrent neural network document embedding. Palestine Technical University Kadoorie Research Journal. 2022. Vol. 10, no. 1, pp.93-102.
https://search.emarefa.net/detail/BIM-1505794
Data Type
Journal Articles
Language
English
Notes
Includes bibliographical references : p. 101-102
Record ID
BIM-1505794