The text document processing in the information retrieval from web pages

المؤلفون المشاركون

Chova, K.
Tak, V.
Ednar, P.

المصدر

International Journal of Intelligent Computing and Information Sciences

العدد

المجلد 6، العدد 2 (31 يوليو/تموز 2006)11ص.

الناشر

جامعة عين شمس كلية الحاسبات و المعلومات

تاريخ النشر

2006-07-31

دولة النشر

مصر

عدد الصفحات

11

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص EN

The paper describes possible representation models and ways of weighting text documents, which can be found on the Internet.

The focus is on automatic extraction of information from texts including pre-processing of text documents.

The paper presents also results of experiments, which were carried out using the 20 News Groups collection of documents.

These experiments concern with the influence of the training set cardinality and a suitable weighting of text documents to the precision of document classification.

The results of experiments with k-means clustering and k-means clustering with controlled initialization are also presented.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Chova, K.& Tak, V.& Ednar, P.. 2006. The text document processing in the information retrieval from web pages. International Journal of Intelligent Computing and Information Sciences،Vol. 6, no. 2.
https://search.emarefa.net/detail/BIM-284200

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Chova, K.…[et al.]. The text document processing in the information retrieval from web pages. International Journal of Intelligent Computing and Information Sciences Vol. 6, no. 2 (Jul. 2006).
https://search.emarefa.net/detail/BIM-284200

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Chova, K.& Tak, V.& Ednar, P.. The text document processing in the information retrieval from web pages. International Journal of Intelligent Computing and Information Sciences. 2006. Vol. 6, no. 2.
https://search.emarefa.net/detail/BIM-284200

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references.

رقم السجل

BIM-284200