Simple-Random-Sampling-Based Multiclass Text Classification Algorithm

المؤلفون المشاركون

Liu, Wuying
Wang, Lin
Yi, Mianzhu

المصدر

The Scientific World Journal

العدد

المجلد 2014، العدد 2014 (31 ديسمبر/كانون الأول 2014)، ص ص. 1-7، 7ص.

الناشر

Hindawi Publishing Corporation

تاريخ النشر

2014-03-19

دولة النشر

مصر

عدد الصفحات

7

التخصصات الرئيسية

الطب البشري
تكنولوجيا المعلومات وعلم الحاسوب

الملخص EN

Multiclass text classification (MTC) is a challenging issue and the corresponding MTC algorithms can be used in many applications.

The space-time overhead of the algorithms must be concerned about the era of big data.

Through the investigation of the token frequency distribution in a Chinese web document collection, this paper reexamines the power law and proposes a simple-random-sampling-based MTC (SRSMTC) algorithm.

Supported by a token level memory to store labeled documents, the SRSMTC algorithm uses a text retrieval approach to solve text classification problems.

The experimental results on the TanCorp data set show that SRSMTC algorithm can achieve the state-of-the-art performance at greatly reduced space-time requirements.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Liu, Wuying& Wang, Lin& Yi, Mianzhu. 2014. Simple-Random-Sampling-Based Multiclass Text Classification Algorithm. The Scientific World Journal،Vol. 2014, no. 2014, pp.1-7.
https://search.emarefa.net/detail/BIM-1049939

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Liu, Wuying…[et al.]. Simple-Random-Sampling-Based Multiclass Text Classification Algorithm. The Scientific World Journal No. 2014 (2014), pp.1-7.
https://search.emarefa.net/detail/BIM-1049939

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Liu, Wuying& Wang, Lin& Yi, Mianzhu. Simple-Random-Sampling-Based Multiclass Text Classification Algorithm. The Scientific World Journal. 2014. Vol. 2014, no. 2014, pp.1-7.
https://search.emarefa.net/detail/BIM-1049939

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references

رقم السجل

BIM-1049939