Analytical study of traditional and intelligent textual plagiarism detection approaches

العناوين الأخرى

دراسة تحليلية للأساليب التقليدية والذكية المستخدمة في كشف السرقة الأكاديمية

المؤلفون المشاركون

Ali, Ayyub
Taqa, Ala Yasin Taha

المصدر

al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah

العدد

المجلد 31، العدد 1 (31 مارس/آذار 2022)، ص ص. 8-25، 18ص.

الناشر

جامعة الموصل كلية التربية للعلوم الصرفة

تاريخ النشر

2022-03-31

دولة النشر

العراق

عدد الصفحات

18

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

توفر شبكة الويب أنواعا مختلفة من البيانات والتطبيقات المتاحة بسهولة للاستكشاف والاستخدام من قبل للمستخدمين.

يحدث انتهاك حقوق النشر في مستندات الويب عند وجود نسخة غير مصرح بها من المعلومات أو النص من المستند الأصلي على الويب؛ يعرف هذا الانتهاك بالانتحال.

يمكن تعريف اكتشاف الانتحال (PD) على أنه الإجراء الذي يجد أوجه التشابه بين مستند معين والمستندات الأخرى بناء على الميزات النصية المعجمية والدلالية والنحوية.

تعتبر مناهج التمثيل الرقمي (تحويل النص) مثل VSM) Vector Space Model) ودمج الكلمات Word Embedding جنبا إلى جنب مع مقاييس تشابه النص مثل مقياس جيب التمام ضرورية للغاية لاكتشاف الانتحال النصي.

تتناول هذه الورقة البحثية مفاهيم الانتحال، أنواع الانتحال، خصائص النصوص أو المستندات النصية، مقاييس تشابه النصوص، وطرائق الكشف عن الانتحال التي تستخدم تقنيات ذكية أو تقليدية.

إذ تم مناقشة أنواع مختلفة من التقنيات التقليدية وخوارزميات التعلم العميق، الشبكة العصبية التلافيفية (CNN) والذاكرة طويلة المدى (LSTM) في كشف النصوص الأدبية.

إلى جانب ذلك، يستعرض هذا العمل العديد من الأوراق الأخرى التي تهتم بموضوع الانتحال النصي وكشفه.

الملخص EN

The web provides various kinds of data and applications that are readily available to explore and are considered a powerful tool for humans.

copyright violation in web documents occurs when there is an unauthorized copy of the information or text from the original document on the web; this violation is known as plagiarism.

plagiarism detection (PD) can be defined as the procedure that finds similarities between a document and other documents based on lexical, semantic, and syntactic textual features.

the approaches for numeric representation (vectorization) of text like vector space model (VSM) and word embedding along with text similarity measures such as cosine and jaccard are very necessary for plagiarism detection.

this paper deals with the concepts of plagiarism, kinds of plagiarism, textual features, text similarity measures, and plagiarism detection methods, which are based on intelligent or traditional techniques.

furthermore, different types of traditional and algorithms of deep learning for instance, convolutional neural network (CNN) and long short-term memory (LSTM) are discussed as a plagiarism detector.

besides that, this work reviews many other papers that give attention to the topic of plagiarism and its detection.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Ali, Ayyub& Taqa, Ala Yasin Taha. 2022. Analytical study of traditional and intelligent textual plagiarism detection approaches. al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah،Vol. 31, no. 1, pp.8-25.
https://search.emarefa.net/detail/BIM-1343046

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Ali, Ayyub& Taqa, Ala Yasin Taha. Analytical study of traditional and intelligent textual plagiarism detection approaches. al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah Vol. 31, no. 1 (2022), pp.8-25.
https://search.emarefa.net/detail/BIM-1343046

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Ali, Ayyub& Taqa, Ala Yasin Taha. Analytical study of traditional and intelligent textual plagiarism detection approaches. al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah. 2022. Vol. 31, no. 1, pp.8-25.
https://search.emarefa.net/detail/BIM-1343046

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references: p. 22-25

رقم السجل

BIM-1343046