WASTK: A Weighted Abstract Syntax Tree Kernel Method for Source Code Plagiarism Detection
المؤلفون المشاركون
Xu, Yanyan
Fu, Deqiang
Yu, Haoran
Yang, Boyang
المصدر
العدد
المجلد 2017، العدد 2017 (31 ديسمبر/كانون الأول 2017)، ص ص. 1-8، 8ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2017-02-13
دولة النشر
مصر
عدد الصفحات
8
التخصصات الرئيسية
الملخص EN
In this paper, we introduce a source code plagiarism detection method, named WASTK (Weighted Abstract Syntax Tree Kernel), for computer science education.
Different from other plagiarism detection methods, WASTK takes some aspects other than the similarity between programs into account.
WASTK firstly transfers the source code of a program to an abstract syntax tree and then gets the similarity by calculating the tree kernel of two abstract syntax trees.
To avoid misjudgment caused by trivial code snippets or frameworks given by instructors, an idea similar to TF-IDF (Term Frequency-Inverse Document Frequency) in the field of information retrieval is applied.
Each node in an abstract syntax tree is assigned a weight by TF-IDF.
WASTK is evaluated on different datasets and, as a result, performs much better than other popular methods like Sim and JPlag.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Fu, Deqiang& Xu, Yanyan& Yu, Haoran& Yang, Boyang. 2017. WASTK: A Weighted Abstract Syntax Tree Kernel Method for Source Code Plagiarism Detection. Scientific Programming،Vol. 2017, no. 2017, pp.1-8.
https://search.emarefa.net/detail/BIM-1203470
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Fu, Deqiang…[et al.]. WASTK: A Weighted Abstract Syntax Tree Kernel Method for Source Code Plagiarism Detection. Scientific Programming No. 2017 (2017), pp.1-8.
https://search.emarefa.net/detail/BIM-1203470
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Fu, Deqiang& Xu, Yanyan& Yu, Haoran& Yang, Boyang. WASTK: A Weighted Abstract Syntax Tree Kernel Method for Source Code Plagiarism Detection. Scientific Programming. 2017. Vol. 2017, no. 2017, pp.1-8.
https://search.emarefa.net/detail/BIM-1203470
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1203470
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر