Semantic Similarity Analysis for Corpus Development and Paraphrase Detection in Arabic
المؤلفون المشاركون
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 18، العدد 1 (31 يناير/كانون الثاني 2021)، ص ص. 1-7، 7ص.
الناشر
جامعة الزرقاء عمادة البحث العلمي
تاريخ النشر
2021-01-31
دولة النشر
الأردن
عدد الصفحات
7
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
Paraphrase detection allows determining how original and suspect documents convey the same meaning.
It has attracted attention from researchers in many Natural Language Processing (NLP) tasks such as plagiarism detection, question answering, information retrieval, etc., Traditional methods (e.g., Term Frequency-Inverse Document Frequency (TF-IDF), Latent Dirichlet Allocation (LDA), and Latent Semantic Analysis (LSA)) cannot capture efficiently hidden semantic relations when sentences may not contain any common words or the co-occurrence of words is rarely present.
Therefore, we proposed a deep learning model based on Global Word embedding (GloVe) and Recurrent Convolutional Neural Network (RCNN).
It was efficient for capturing more contextual dependencies between words vectors with precise semantic meanings.
Seeing the lack of resources in Arabic language publicly available, we developed a paraphrased corpus automatically.
It preserved syntactic and semantic structures of Arabic sentences using word2vec model and Part-Of-Speech (POS) annotation.
Overall experiments shown that our proposed model outperformed the state-of-the-art methods in terms of precision and recall.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Adnen Mahmoud& Zrigui, Mounir. 2021. Semantic Similarity Analysis for Corpus Development and Paraphrase Detection in Arabic. The International Arab Journal of Information Technology،Vol. 18, no. 1, pp.1-7.
https://search.emarefa.net/detail/BIM-1430914
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Adnen Mahmoud& Zrigui, Mounir. Semantic Similarity Analysis for Corpus Development and Paraphrase Detection in Arabic. The International Arab Journal of Information Technology Vol. 18, no. 1 (Jan. 2021), pp.1-7.
https://search.emarefa.net/detail/BIM-1430914
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Adnen Mahmoud& Zrigui, Mounir. Semantic Similarity Analysis for Corpus Development and Paraphrase Detection in Arabic. The International Arab Journal of Information Technology. 2021. Vol. 18, no. 1, pp.1-7.
https://search.emarefa.net/detail/BIM-1430914
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Text in English ; abstracts in .
رقم السجل
BIM-1430914
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر