Increasing search engine's accuracy using links clustering

العناوين الأخرى

زيادة دقة محركات البحث بعنقدة روابط الإنترنيت

المؤلف

Abbas, Ahmad Baha al-Din Abd al-Wahhab

المصدر

al-Mansour

الناشر

كلية المنصور الجامعة :

تاريخ النشر

2010-12-31

دولة النشر

العراق

عدد الصفحات

19

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص العربي

تخصصت الدراسة في مشكلة البحث عن الكتب الإلكترونیة المجانیة تحدیدا لما لھا من أھمیة مع تزاید المكتبات الإلكترونیة و ذلك عند طلب الباحث عن الكتب المجانیة تقوم محركات البحث بإعادة مواقع بیع الكتب ضمن النتائج مما یعطي انطباع بعدم دقة أو وثوقیة محركات البحث ھذه، لذا قام العمل على فلسفة عنقدة عینة من مواقع الانترنت المختلفة على أساس عدد الروابط الموجودة فیھا فعلا و التي تقود إلى كتب إلكترونیة و منحھا رتبة أعلى من بقیة المواقع مع الاخذ بنفر الإعتبار تشابه الكلمة المدخلة من مستخدم محرك البحث و على ھذا الأساس تم استنتاج ثلاثة أصناف) مواقع ذات اسبقیة عالیة، مواقع ذات اسبقیة متوسطة، مواقع ذات اسبقیة قلیلة.

المنظومة المقترحة ھي محرك البحث (Ico.com) و تم بناءه من عده مكونات، المكون الأول عنكبوت الویب (web crawler)و هو برنامج لسحب المعلومات المتعلقة بصفحات الانترنت مثل (عنوان الصفحة، موضوعها، كلماتها المفتاحية و الروابط الموجودة فيها و عددها ...

الخ) و الجزء الأخر ھو برنامج العنقدة لعنقدة قاعدة بیانات صفحات الانترنت حسب أعداد الروابط و أخیرا واجھة محرك البحث بنيت بلغتي HTML و VB Script و بتقنیة صفحات الخادم الفعالة (Active server pages).

إن ھذا العمل توصل إلى إمكانیة زیادة دقة محركات البحث بالإعتماد على عناصر أخرى غیر تطابق الكلمات مثل تحلیل عدد و نوع الروابط بتحلیل قواعد بیانات محركات البحث .

الملخص الإنجليزي

This study is devoted for searching free e-books problem because of its importance with spreading the e-libraries.

When the web client asking for a free e-books the search engine returns selling e-books sites, this produce a conclusion of inaccuracy about this search engine.

According to this case this study suggest the philosophy of clustering a sample of web sites on the number of links which lead to the downloadable e-books and rank this sites higher than the others with matching the entered keywords.

Three clusters have been noticed (sites with high rank, sites with medium ranking, and low ranked sites). The proposed system (Ico.

com) has been built form many components ; the first is the web crawler which is a software Program for fetching data of web pages (like page address, subject, number of links…etc), the second component is the clustering program written using (VB6.0) language to cluster the web pages databases according to the number of links to real existing downloadable books, and the last component is the search engine interface which is built using HTML and VB script under Active server pages technology.

This work reached to increasing the search engine accuracy using factors like analyzing the number and the type of links by mining the web site’s database to improve accuracy for search engines.

نوع البيانات

أوراق مؤتمرات

رقم السجل

BIM-326026

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Abbas, Ahmad Baha al-Din Abd al-Wahhab. 2010-12-31. Increasing search engine's accuracy using links clustering. Scientific Conference (10th : 2009 : Baghdad, Iraq). . Vol. 14, p. 2 (2010), pp.51-69.Baghdad Iraq : al-Mansour University College.
https://search.emarefa.net/detail/BIM-326026

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Abbas, Ahmad Baha al-Din Abd al-Wahhab. Increasing search engine's accuracy using links clustering. . Baghdad Iraq : al-Mansour University College. 2010-12-31.
https://search.emarefa.net/detail/BIM-326026

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Abbas, Ahmad Baha al-Din Abd al-Wahhab. Increasing search engine's accuracy using links clustering. . Scientific Conference (10th : 2009 : Baghdad, Iraq).
https://search.emarefa.net/detail/BIM-326026