Preceding document clustering by graph mining based maximal frequent termsets preservation
المؤلفون المشاركون
Amjad, Muhammad
Shah, Sayyid Abd al-Baqi
المصدر
The International Arab Journal of Information Technology
العدد
المجلد 16، العدد 3 (31 مايو/أيار 2019)، ص ص. 364-370، 7ص.
الناشر
تاريخ النشر
2019-05-31
دولة النشر
الأردن
عدد الصفحات
7
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الموضوعات
الملخص EN
This paper presents an approach to cluster documents.
It introduces a novel graph mining based algorithm to find frequent termsets present in a document set.
The document set is initially mapped onto a bipartite graph.
Based on the results of our algorithm, the document set is modified to reduce its dimensionality.
Then, Bisecting K-means algorithm is executed over the modified document set to obtain a set of very meaningful clusters.
It has been shown that the proposed approach, Clustering preceded by Graph Mining based Maximal Frequent Termsets Preservation (CGFTP), produces better quality clusters than produced by some classical document clustering algorithm(s).
It has also been shown that the produced clusters are easily interpretable.
The quality of clusters has been measured in terms of their F-measure.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Shah, Sayyid Abd al-Baqi& Amjad, Muhammad. 2019. Preceding document clustering by graph mining based maximal frequent termsets preservation. The International Arab Journal of Information Technology،Vol. 16, no. 3, pp.364-370.
https://search.emarefa.net/detail/BIM-894778
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Shah, Sayyid Abd al-Baqi& Amjad, Muhammad. Preceding document clustering by graph mining based maximal frequent termsets preservation. The International Arab Journal of Information Technology Vol. 16, no. 3 (May. 2019), pp.364-370.
https://search.emarefa.net/detail/BIM-894778
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Shah, Sayyid Abd al-Baqi& Amjad, Muhammad. Preceding document clustering by graph mining based maximal frequent termsets preservation. The International Arab Journal of Information Technology. 2019. Vol. 16, no. 3, pp.364-370.
https://search.emarefa.net/detail/BIM-894778
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 369-370
رقم السجل
BIM-894778
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر