طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية

Joint Authors

ذنون، باسل يونس
ربى طلال إبراهيم

Source

المجلة العراقية للعلوم الإحصائية

Publisher

University of Mosul College of Computer Science and Mathematics

Publication Date

2013-12-31

Country of Publication

Iraq

No. of Pages

18

Main Subjects

Information Technology and Computer Science

Topics

Arabic Abstract

إن الزيادة الهائلة للوثائق المتوفرة في شبكة الإنترنت العالمية و سهولة الوصول بمها أدى إلى مشكلة خطيرة تتمثل في استخدام أعمال الآخرين من دون إعطاءهم أي إئتمانات.

و على الرغم من تطوير العديد من الأساليب للكشف عن بعض حالات الارتحال مثل تغيير بنية الجمل أو استبدال الكلمات بمفرداتها، إلا أنه من الصعب كشف الانتحال عند التعديل على الجمل المنسوخة بشكل متعمد.

يقته في هذا البحث نظام يستخدم خوارزمية التشابه الدلالي للكشف عن الانتحال.

لقد تم عمل قاعدة بيانات تتضمن النصوص الأصلية من مختلف المجالات، و تم اختيار عدد منها لتكون مصدرا لعشرة نصوص منتحلة يدويا.

و نعتمد خوارزمية التشابه الدلالي لحساب التشابه بين الوثائق الأصلية و الوثيقة المدخلة اعتمادا على اشتراكها بأكبر عدد من الكلمات المتشابهة.

و قد تم إجراء تحسين عليها بإيجاب التشابه بين الوثائق النظام بمطابقة الوثيقة المنتحلة المدخلة و نصوص قاعدة البيانات و استرجاع نسب التشابه للنصوص التي تزيد عن 50 %.

كما يقوم النظام بالمطابقة بين النصين الأصلي و المنتحل و استرجاع النسبة المئوية للتشابه بينهما و عدد الكلمات و الأسماء و الأفعال و الصفات و الظروف المتشابه كتابة و معنى.

English Abstract

The massive increase in documents on the world-wide web and the ease to reach them have led to a dangerous problem which is using others' works without giving them credits.

Although a number of methods have been developed to discover some cases of plagiarism, as changing sentence structure or replacing words with their synonyms, it is still difficult to diagnose plagiarism when modifying deliberately quoted sentences.

In this paper a Semantic Similarity Algorithm System is proposed for discovering plagiarism in texts using semantic networks.

A data base is formed to accommodate the original texts belonging to different fields.

The system depends on determining the degree of similarity between original documents and inserted documents on the basis of sharing the largest number of similar words.

It has been improved by determining the similarity between the plagiarized documents and the big source books in addition to words of multiple meanings.

It compares the plagiarized document to the data base text, and recalls the text percentage of similarity over 50 %.

It also compares the original text with the plagiarized one and recall the percentage of similarity between them as well as the number of nouns, verbs, adjective and adverbs which are similar in both writing and meaning.

Data Type

Conference Papers

Record ID

BIM-345520

American Psychological Association (APA)

ذنون، باسل يونس وربى طلال إبراهيم. 2013-12-31. طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية. المؤتمر العلمي لكلية علوم الحاسوب و الرياضيات (6 : 2013 : الموصل، العراق). . مج. 13، ع. 25 (2013)، ص ص. 456-473.الموصل، العراق : جامعة الموصل، كلية علوم الحاسبات و الرياضيات،.
https://search.emarefa.net/detail/BIM-345520

Modern Language Association (MLA)

ذنون، باسل يونس وربى طلال إبراهيم. طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية. . الموصل، العراق : جامعة الموصل، كلية علوم الحاسبات و الرياضيات،. 2013-12-31.
https://search.emarefa.net/detail/BIM-345520

American Medical Association (AMA)

ذنون، باسل يونس وربى طلال إبراهيم. طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنكليزية باستخدام الشبكات الدلالية. . المؤتمر العلمي لكلية علوم الحاسوب و الرياضيات (6 : 2013 : الموصل، العراق).
https://search.emarefa.net/detail/BIM-345520