Topical web crawling for domain-specific resource discovery enhanced by selectively using link-context
المؤلفون المشاركون
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 12، العدد 2 (31 مارس/آذار 2015)9ص.
الناشر
تاريخ النشر
2015-03-31
دولة النشر
الأردن
عدد الصفحات
9
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الموضوعات
الملخص EN
To enable topical Web crawling, link-context is the critical contextual information of anchor text for retrieving domain-specific resources.
While some link-contexts may misguide topical Web crawling and extract wrong Web pages, because several relevant anchor texts become irrelevant or several irrelevant anchor texts become relevant after calculating the relevance between the link-contexts and the feature terms of the specific topic.
In view of above, this paper presents a heuristic-based approach by selectively using link-context and implements DOM tree to locate the anchor text.
Unlike previous crawling algorithms, which only zero in on link-context and ignore whether it is really needed or not? Our method cares both link-context and evaluating its necessity to correctly use link-context to guide topical crawling.
Accordingly, our topical crawler can retrieve more relevant Web pages.
Experimental results indicate that this approach outperforms breadthfirst, best-first, anchor text only, link-context both in harvest rate and target recall.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Liu, Lu& Peng, Tao& Zuo, Wanli. 2015. Topical web crawling for domain-specific resource discovery enhanced by selectively using link-context. The International Arab Journal of Information Technology،Vol. 12, no. 2.
https://search.emarefa.net/detail/BIM-368881
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Liu, Lu…[et al.]. Topical web crawling for domain-specific resource discovery enhanced by selectively using link-context. The International Arab Journal of Information Technology Vol. 12, no. 2 (Mar. 2015).
https://search.emarefa.net/detail/BIM-368881
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Liu, Lu& Peng, Tao& Zuo, Wanli. Topical web crawling for domain-specific resource discovery enhanced by selectively using link-context. The International Arab Journal of Information Technology. 2015. Vol. 12, no. 2.
https://search.emarefa.net/detail/BIM-368881
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Text in English ; abstracts in English and Arabic.
رقم السجل
BIM-368881
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر