A hierarchical K-NN classifier for textual data
المؤلفون المشاركون
al-Zubaydi, Raniya
al-Duwayri, Rehab
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 8، العدد 3 (31 يوليو/تموز 2011)، ص ص. 251-259، 9ص.
الناشر
تاريخ النشر
2011-07-31
دولة النشر
الأردن
عدد الصفحات
9
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الموضوعات
الملخص EN
This paper presents a classifier that is based on a modified version of the well known K-Nearest Neighbors classifier (K-NN).
The original K-NN classifier was adjusted to work with category representatives rather than training documents.
Each category was represented by one document that was constructed by consulting all of its training documents and then applying feature selection so that only important terms remain.
By this, when classifying a new document, it is required to be compared with category representatives and these are usually substantially fewer than training documents.
This modified K-NN was experimented with in a hierarchical setting, i.e.
when categories are represented as a hierarchy.
Also, a new document similarity measure was proposed.
It focuses on co-occurring or matching terms between a document and a category when calculating the similarity.
This measure produces classification accuracy compared to the one obtained if the cosine, Jaccard or Dice similarity measures were used; yet it requires a much less time.
The TrechTC-100 hierarchical dataset was used to evaluate the proposed classifier.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
al-Duwayri, Rehab& al-Zubaydi, Raniya. 2011. A hierarchical K-NN classifier for textual data. The International Arab Journal of Information Technology،Vol. 8, no. 3, pp.251-259.
https://search.emarefa.net/detail/BIM-265405
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
al-Duwayri, Rehab& al-Zubaydi, Raniya. A hierarchical K-NN classifier for textual data. The International Arab Journal of Information Technology Vol. 8, no. 3 (Jul. 2011), pp.251-259.
https://search.emarefa.net/detail/BIM-265405
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
al-Duwayri, Rehab& al-Zubaydi, Raniya. A hierarchical K-NN classifier for textual data. The International Arab Journal of Information Technology. 2011. Vol. 8, no. 3, pp.251-259.
https://search.emarefa.net/detail/BIM-265405
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 257-259
رقم السجل
BIM-265405
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر