Increasing search engine's accuracy using links clustering

Other Title(s)

زيادة دقة محركات البحث بعنقدة روابط الإنترنيت

Author

Abbas, Ahmad Baha al-Din Abd al-Wahhab

Source

al-Mansour

Publisher

al-Mansour University College

Publication Date

2010-12-31

Country of Publication

Iraq

No. of Pages

19

Main Subjects

Information Technology and Computer Science

Topics

Arabic Abstract

تخصصت الدراسة في مشكلة البحث عن الكتب الإلكترونیة المجانیة تحدیدا لما لھا من أھمیة مع تزاید المكتبات الإلكترونیة و ذلك عند طلب الباحث عن الكتب المجانیة تقوم محركات البحث بإعادة مواقع بیع الكتب ضمن النتائج مما یعطي انطباع بعدم دقة أو وثوقیة محركات البحث ھذه، لذا قام العمل على فلسفة عنقدة عینة من مواقع الانترنت المختلفة على أساس عدد الروابط الموجودة فیھا فعلا و التي تقود إلى كتب إلكترونیة و منحھا رتبة أعلى من بقیة المواقع مع الاخذ بنفر الإعتبار تشابه الكلمة المدخلة من مستخدم محرك البحث و على ھذا الأساس تم استنتاج ثلاثة أصناف) مواقع ذات اسبقیة عالیة، مواقع ذات اسبقیة متوسطة، مواقع ذات اسبقیة قلیلة.

المنظومة المقترحة ھي محرك البحث (Ico.com) و تم بناءه من عده مكونات، المكون الأول عنكبوت الویب (web crawler)و هو برنامج لسحب المعلومات المتعلقة بصفحات الانترنت مثل (عنوان الصفحة، موضوعها، كلماتها المفتاحية و الروابط الموجودة فيها و عددها ...

الخ) و الجزء الأخر ھو برنامج العنقدة لعنقدة قاعدة بیانات صفحات الانترنت حسب أعداد الروابط و أخیرا واجھة محرك البحث بنيت بلغتي HTML و VB Script و بتقنیة صفحات الخادم الفعالة (Active server pages).

إن ھذا العمل توصل إلى إمكانیة زیادة دقة محركات البحث بالإعتماد على عناصر أخرى غیر تطابق الكلمات مثل تحلیل عدد و نوع الروابط بتحلیل قواعد بیانات محركات البحث .

English Abstract

This study is devoted for searching free e-books problem because of its importance with spreading the e-libraries.

When the web client asking for a free e-books the search engine returns selling e-books sites, this produce a conclusion of inaccuracy about this search engine.

According to this case this study suggest the philosophy of clustering a sample of web sites on the number of links which lead to the downloadable e-books and rank this sites higher than the others with matching the entered keywords.

Three clusters have been noticed (sites with high rank, sites with medium ranking, and low ranked sites). The proposed system (Ico.

com) has been built form many components ; the first is the web crawler which is a software Program for fetching data of web pages (like page address, subject, number of links…etc), the second component is the clustering program written using (VB6.0) language to cluster the web pages databases according to the number of links to real existing downloadable books, and the last component is the search engine interface which is built using HTML and VB script under Active server pages technology.

This work reached to increasing the search engine accuracy using factors like analyzing the number and the type of links by mining the web site’s database to improve accuracy for search engines.

Data Type

Conference Papers

Record ID

BIM-326026

American Psychological Association (APA)

Abbas, Ahmad Baha al-Din Abd al-Wahhab. 2010-12-31. Increasing search engine's accuracy using links clustering. Scientific Conference (10th : 2009 : Baghdad, Iraq). . Vol. 14, p. 2 (2010), pp.51-69.Baghdad Iraq : al-Mansour University College.
https://search.emarefa.net/detail/BIM-326026

Modern Language Association (MLA)

Abbas, Ahmad Baha al-Din Abd al-Wahhab. Increasing search engine's accuracy using links clustering. . Baghdad Iraq : al-Mansour University College. 2010-12-31.
https://search.emarefa.net/detail/BIM-326026

American Medical Association (AMA)

Abbas, Ahmad Baha al-Din Abd al-Wahhab. Increasing search engine's accuracy using links clustering. . Scientific Conference (10th : 2009 : Baghdad, Iraq).
https://search.emarefa.net/detail/BIM-326026