Intelligent websites' content analyzing and classification system

Joint Authors

al-Bakri, Abbas Muhsin
Hashush, Talib Turki

Source

Journal of Babylon University : Journal of Applied and Pure Sciences

Issue

Vol. 22, Issue 7 (31 Dec. 2014), pp.1871-1876, 6 p.

Publisher

University of Babylon

Publication Date

2014-12-31

Country of Publication

Iraq

No. of Pages

6

Main Subjects

Telecommunications Engineering

Topics

Abstract AR

يمكن اعتبار الويب كمستودع معلومات لا متناهي و ذلك بسبب ضخامة المعلومات التي يمكث أن يحتويها.

و لكن مع هذه الميزة (الفائدة) فهو أيضا يمتلك بعض المشاكل, بسبب الطبيعة غير المنتظمة للويب, فأنه جعل بإمكان أي شخص جعل أي محتوى متوفر على صفحات الويب حتى لو كانت هذه المحتويات ضارة للناس مثل المحتويات التي تشير للكره (الحقد) و المواد الإباحية.

لهذا السبب فان وجود نظام تصنيف و تصفية المواقع أصبح ضروريا.

في هذا البحث نقدم نظام تصنيف المواقع باستخدام خوارزمية (Fuzzy C-Means) بالاعتماد على الخصائص النصية من اجل تصنيف المواقع إلى فئتين : البيضاء التي لا تحتوي على المواد الإباحية و الأخرى السوداء التي تحتوي على المواد الإباحة.

Abstract EN

The Web can consider as infinite repository of information because of the vast amount of information that they can contain, but with this advantage of Web, it also some drawbacks, because of unregulated nature of the Web, it is led to make any one make any contents available on the Web even though this content is objectionable for people like violence and pornographic contents.

Therefore existing of Web content classification and filtering systems is necessary.

In this paper we produce Website classification system using Fuzzy C-Means based on textual features, to classify the Website to two categories : (white) that not contain pornographic materials and (black) that contain pornographic materials.

American Psychological Association (APA)

al-Bakri, Abbas Muhsin& Hashush, Talib Turki. 2014. Intelligent websites' content analyzing and classification system. Journal of Babylon University : Journal of Applied and Pure Sciences،Vol. 22, no. 7, pp.1871-1876.
https://search.emarefa.net/detail/BIM-397483

Modern Language Association (MLA)

al-Bakri, Abbas Muhsin& Hashush, Talib Turki. Intelligent websites' content analyzing and classification system. Journal of Babylon University : Journal of Applied and Pure Sciences Vol. 22, no. 7 (2014), pp.1871-1876.
https://search.emarefa.net/detail/BIM-397483

American Medical Association (AMA)

al-Bakri, Abbas Muhsin& Hashush, Talib Turki. Intelligent websites' content analyzing and classification system. Journal of Babylon University : Journal of Applied and Pure Sciences. 2014. Vol. 22, no. 7, pp.1871-1876.
https://search.emarefa.net/detail/BIM-397483

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 1876

Record ID

BIM-397483