طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية

المؤلفون المشاركون

ذنون، باسل يونس
ربى طلال إبراهيم

المصدر

المجلة العراقية للعلوم الإحصائية

الناشر

جامعة الموصل كلية علوم الحاسبات و الرياضيات

تاريخ النشر

2013-12-31

دولة النشر

العراق

عدد الصفحات

18

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص العربي

إن الزيادة الهائلة للوثائق المتوفرة في شبكة الإنترنت العالمية و سهولة الوصول بمها أدى إلى مشكلة خطيرة تتمثل في استخدام أعمال الآخرين من دون إعطاءهم أي إئتمانات.

و على الرغم من تطوير العديد من الأساليب للكشف عن بعض حالات الارتحال مثل تغيير بنية الجمل أو استبدال الكلمات بمفرداتها، إلا أنه من الصعب كشف الانتحال عند التعديل على الجمل المنسوخة بشكل متعمد.

يقته في هذا البحث نظام يستخدم خوارزمية التشابه الدلالي للكشف عن الانتحال.

لقد تم عمل قاعدة بيانات تتضمن النصوص الأصلية من مختلف المجالات، و تم اختيار عدد منها لتكون مصدرا لعشرة نصوص منتحلة يدويا.

و نعتمد خوارزمية التشابه الدلالي لحساب التشابه بين الوثائق الأصلية و الوثيقة المدخلة اعتمادا على اشتراكها بأكبر عدد من الكلمات المتشابهة.

و قد تم إجراء تحسين عليها بإيجاب التشابه بين الوثائق النظام بمطابقة الوثيقة المنتحلة المدخلة و نصوص قاعدة البيانات و استرجاع نسب التشابه للنصوص التي تزيد عن 50 %.

كما يقوم النظام بالمطابقة بين النصين الأصلي و المنتحل و استرجاع النسبة المئوية للتشابه بينهما و عدد الكلمات و الأسماء و الأفعال و الصفات و الظروف المتشابه كتابة و معنى.

الملخص الإنجليزي

The massive increase in documents on the world-wide web and the ease to reach them have led to a dangerous problem which is using others' works without giving them credits.

Although a number of methods have been developed to discover some cases of plagiarism, as changing sentence structure or replacing words with their synonyms, it is still difficult to diagnose plagiarism when modifying deliberately quoted sentences.

In this paper a Semantic Similarity Algorithm System is proposed for discovering plagiarism in texts using semantic networks.

A data base is formed to accommodate the original texts belonging to different fields.

The system depends on determining the degree of similarity between original documents and inserted documents on the basis of sharing the largest number of similar words.

It has been improved by determining the similarity between the plagiarized documents and the big source books in addition to words of multiple meanings.

It compares the plagiarized document to the data base text, and recalls the text percentage of similarity over 50 %.

It also compares the original text with the plagiarized one and recall the percentage of similarity between them as well as the number of nouns, verbs, adjective and adverbs which are similar in both writing and meaning.

نوع البيانات

أوراق مؤتمرات

رقم السجل

BIM-345520

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

ذنون، باسل يونس وربى طلال إبراهيم. 2013-12-31. طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية. المؤتمر العلمي لكلية علوم الحاسوب و الرياضيات (6 : 2013 : الموصل، العراق). . مج. 13، ع. 25 (2013)، ص ص. 456-473.الموصل، العراق : جامعة الموصل، كلية علوم الحاسبات و الرياضيات،.
https://search.emarefa.net/detail/BIM-345520

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

ذنون، باسل يونس وربى طلال إبراهيم. طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية. . الموصل، العراق : جامعة الموصل، كلية علوم الحاسبات و الرياضيات،. 2013-12-31.
https://search.emarefa.net/detail/BIM-345520

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

ذنون، باسل يونس وربى طلال إبراهيم. طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية. . المؤتمر العلمي لكلية علوم الحاسوب و الرياضيات (6 : 2013 : الموصل، العراق).
https://search.emarefa.net/detail/BIM-345520