![](/images/graphics-bg.png)
An effective preprocessing step algorithm in text mining application
المؤلفون المشاركون
Hadi, R. M.
Hashim, S. H.
Mawlud, A. T.
المصدر
Engineering and Technology Journal
العدد
المجلد 35، العدد 2B (28 فبراير/شباط 2017)، ص ص. 126-131، 6ص.
الناشر
تاريخ النشر
2017-02-28
دولة النشر
العراق
عدد الصفحات
6
التخصصات الرئيسية
العلوم الهندسية والتكنولوجية (متداخلة التخصصات)
الملخص EN
Text mining was a process of mining the significant information from the text documents.
Any text mining system was created its process by preprocessing step; which involve tokenization, stop words removal, stemming and finally creating term frequency and inverse document frequency matrix (TF-IDF matrix).
These steps provide the highest time consuming stage in knowledge discovery.
The proposed method tries to build effective preprocessing step to even win area of memory space and time requirements.
That by proposed a method for improved stop words removal algorithm and improved stemming algorithm based porter stemming algorithm.
The proposed method is tested in two levels, first level uses only vector space model which based on used traditional stop words removal and with traditional porter stemming and the second level uses vector space model with combined features of improved stop words removal algorithm and improved stemming algorithm.
The results show that using second level as effective preprocessing step for text mining application achieves good performance from reducing storage space used in memory about 10% and the processing time become faster which achieves good performance to build the final TF-IDF matrix.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Hadi, R. M.& Hashim, S. H.& Mawlud, A. T.. 2017. An effective preprocessing step algorithm in text mining application. Engineering and Technology Journal،Vol. 35, no. 2B, pp.126-131.
https://search.emarefa.net/detail/BIM-808646
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Hadi, R. M.…[et al.]. An effective preprocessing step algorithm in text mining application. Engineering and Technology Journal Vol. 35, no. 2B (2017), pp.126-131.
https://search.emarefa.net/detail/BIM-808646
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Hadi, R. M.& Hashim, S. H.& Mawlud, A. T.. An effective preprocessing step algorithm in text mining application. Engineering and Technology Journal. 2017. Vol. 35, no. 2B, pp.126-131.
https://search.emarefa.net/detail/BIM-808646
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 131
رقم السجل
BIM-808646
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
![](/images/ebook-kashef.png)
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر
![](/images/kashef-image.png)