Prevent xpath and CSS based scrapers by using markup randomizer
المؤلفون المشاركون
المصدر
International Arab Journal of E-Technology
العدد
المجلد 5، العدد 2 (30 يونيو/حزيران 2018)، ص ص. 78-87، 10ص.
الناشر
تاريخ النشر
2018-06-30
دولة النشر
الأردن
عدد الصفحات
10
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
Web Scraping may consider as data theft action, several researchers have introduced some approaches for addressing this issue.
These solutions could solve the problem in partial ways and sometimes, solution cannot be applicable with modern web techniques.
Consequently, in our work we have introduced a new approach for stopping web scraping in an efficient way and applicable with modern web techniques called Markup Randomizer, which changes the HTML and CSS in proper way randomly in timely manner.
The best feature of our model is that each web page can use it without paying any efforts or restrictions in web site markup.
Experiments done over collected dataset which consist of 30 websites divided into three categories: News, Currency Rates and Weather.
The proposed model based on Markup Randomizer applied over this dataset.
The aim of the experimental is to measure the Similarity, File Size and the time.
During testing the proposed model, we get that a change on the markup done up to 50%, file size is changed and optimized after during the process.
The required time to applying the model and generating the new markup is good and up to 2 minutes.
Finally, we find that our proposed markup randomizer is accepted
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Diyab, Ahmad& Barhum, Tawfiq. 2018. Prevent xpath and CSS based scrapers by using markup randomizer. International Arab Journal of E-Technology،Vol. 5, no. 2, pp.78-87.
https://search.emarefa.net/detail/BIM-845872
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Diyab, Ahmad& Barhum, Tawfiq. Prevent xpath and CSS based scrapers by using markup randomizer. International Arab Journal of E-Technology Vol. 5, no. 2 (Jun. 2018), pp.78-87.
https://search.emarefa.net/detail/BIM-845872
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Diyab, Ahmad& Barhum, Tawfiq. Prevent xpath and CSS based scrapers by using markup randomizer. International Arab Journal of E-Technology. 2018. Vol. 5, no. 2, pp.78-87.
https://search.emarefa.net/detail/BIM-845872
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 87
رقم السجل
BIM-845872
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر