Text mining : extract numerical measures to identify documents attributes

المؤلف

Salman, Mahdi Abd

المصدر

Journal of Babylon University : Journal of Applied and Pure Sciences

العدد

المجلد 18، العدد 3 (30 سبتمبر/أيلول 2010)6ص.

الناشر

جامعة بابل

تاريخ النشر

2010-09-30

دولة النشر

العراق

عدد الصفحات

6

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

الغرض من عملية التنقيب في النصوص لمعالجة المعلومات الغير مهيكلة و استخلاص أرقام ذات معنى من النصوص و كذلك توفير إمكانية الوصول للمعلومات الموجودة في النص لمختلف خوارزميات التنقيب.

بالاعتماد على المعالجة الأولية للملفات النصية تم استخدام طريقة للتنقيب في النص لاستخدامها في استخراج و تحديد الكلمات المهمة في النص و التي تدخل لاحقا في خوارزميات التصنيف.

الملخص EN

The purpose of Text Mining is to process unstructured (textual) information, extract meaningful numeric indices from the text, and, thus, make the information contained in the text accessible to the various data mining (statistical and machine learning) algorithms.

We have described here approach to text mining that is based on a preprocessing of documents to identify significant words and phrases to be used as attributes in the classification algorithm.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Salman, Mahdi Abd. 2010. Text mining : extract numerical measures to identify documents attributes. Journal of Babylon University : Journal of Applied and Pure Sciences،Vol. 18, no. 3.
https://search.emarefa.net/detail/BIM-287505

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Salman, Mahdi Abd. Text mining : extract numerical measures to identify documents attributes. Journal of Babylon University : Journal of Applied and Pure Sciences Vol. 18, no. 3 (2010 ).
https://search.emarefa.net/detail/BIM-287505

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Salman, Mahdi Abd. Text mining : extract numerical measures to identify documents attributes. Journal of Babylon University : Journal of Applied and Pure Sciences. 2010. Vol. 18, no. 3.
https://search.emarefa.net/detail/BIM-287505

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references.

رقم السجل

BIM-287505