A knowledge based system for automatic classification of web pages

المؤلفون المشاركون

al-Budur, Hamid Saqr
Kaabnah, Khalid A.
Fathi, Sharif Qasim

المصدر

Mu'tah Journal for Research and Studies : Natural and Applied Sciences Series

العدد

المجلد 22، العدد 1 (30 إبريل/نيسان 2007)، ص ص. 43-55، 13ص.

الناشر

جامعة مؤتة عمادة البحث العلمي

تاريخ النشر

2007-04-30

دولة النشر

الأردن

عدد الصفحات

13

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

يقوم البحث بوصف شامل و تطبيق لمعرفة جديدة لنظام قائم على المعلومات الآلية لقواعد البيانات المسترجعة (A1RDB).

يساعد هذا النظام المستخدم على تجميع صفحات الويب و تصنيفها على أساس تصفية المعلومات بالاشتراك مع الشبكة العصبوية الاصطناعية.

يعتمد التصنيف في الغالب على الكلمة الرئيسية في الفهارس.

تم تخصيص مجموعة كبيرة من ألعينات تتألف من 11043 صفحة ويب في صبغ مختلفة تجمع آليا و عشوائيا من مصادر متعددة لاختبار ميزة اختيار خوارزمية AIRDB.

تعتمد ميزة الاختيار على تدفق كلمات صفحات الويب، تدفق كل كلمة ينتج في مكان جانبا، هذا المكان يحتوي على المعلومات التي تدل على وزن كل تدفق مع احتمالية الفئات المترابطة لصفحات الويب.

عملية التحليل الإحصائي وضحت لتقليل ضجيج التدفق.

تم وصف عناصر AIRDB المتعددة.

تم اختبار هذا النظام على صفحات ويب متعددة و التي تنشر باللغة الإنجليزية حيث تم حساب مدى كفاءة أداء AIRDB ال 84 %.

الملخص EN

The paper describes design and implementation of a new knowledge based system for Automatic Information Retrieval DataBase (AIRDB).

AIRDB helps the end-user to cluster and classify web pages on the basis of information filtering combined with an Artificial Neural Network (ANN).

The classification depends mainly on keyword indexes.

A large sample set consists of 11043 web pages of several formats are collected automatically and randomly from various resources.

The AIRDB feature selection algorithm is summarized.

The feature selection depends upon stemming words of web page.

Each stem word is generated with local profile.

This local profile contains information that indicates the weight of each stem with the possible related classes of web pages.

A statistical analysis process is illustrated to reduce the noise stems.

The various components of the AIRDB are described.

The knowledge based system is tested with various web pages that disseminate their content in English.

The average discrimination performance of the AIRDB reaches 84 %.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

al-Budur, Hamid Saqr& Kaabnah, Khalid A.& Fathi, Sharif Qasim. 2007. A knowledge based system for automatic classification of web pages. Mu'tah Journal for Research and Studies : Natural and Applied Sciences Series،Vol. 22, no. 1, pp.43-55.
https://search.emarefa.net/detail/BIM-284947

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

al-Budur, Hamid Saqr…[et al.]. A knowledge based system for automatic classification of web pages. Mu'tah Journal for Research and Studies : Natural and Applied Sciences Series Vol. 22, no. 1 (2007), pp.43-55.
https://search.emarefa.net/detail/BIM-284947

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

al-Budur, Hamid Saqr& Kaabnah, Khalid A.& Fathi, Sharif Qasim. A knowledge based system for automatic classification of web pages. Mu'tah Journal for Research and Studies : Natural and Applied Sciences Series. 2007. Vol. 22, no. 1, pp.43-55.
https://search.emarefa.net/detail/BIM-284947

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 55

رقم السجل

BIM-284947