Classification and retrieving printed Arabic document images based on bagged decision tree classifier
Other Title(s)
تصنيف و استرجاع الوثائق العربية المطبوعة بالاعتماد على المصنف شجرة القرار Bagged
Joint Authors
Abbas, Haytham Karim
Abd al-Munim, Mathil Imad al-Din
Source
Issue
Vol. 2019, Issue 32 (31 Dec. 2019), pp.14-33, 20 p.
Publisher
Publication Date
2019-12-31
Country of Publication
Iraq
No. of Pages
20
Main Subjects
Topics
Abstract AR
إن استرجاع صورة الوثائق العربية المطبوعة هو نظام مهم جدا و مطلوب للعديد من التطبيقات بما في ذلك الأرشفة الإلكترونية و محركات البحث و أنظمة إدارة الوثائق.
في هذه البحث تم اقتراح نظام متكيف لتصنيف و استرجاع الوثائق العربية المطبوعة استنادا الى الكلمات الرأسية بالاعتماد على طريقة شجرة القرار (Decision Tree) التي تم تحسينها بواسطة تقنية.
Baggingيقوم النظام المقترح بتطبيق تقنيات المعالجة المسبقة و التجزئة الفعالة لإعداد الوثيقة و كشف الكلمات الرأسية من وثيقة الاستعلام و بالإضافة إلى ذلك، تم استخراج مجموعة من الميزات التمييزية من الكلمات الرأس المستخرجة لتصنيفها بشكل صحيح إلى الصنف الصحيح.
في النظام المقترح، تم تكييف تقنية Bagging مع المصنف شجرة القرار لتعزيز أداء التصنيف و بالتالي تحسين دقة استرجاع الوثائق.
اثبتت التجارب ان النظام المقترح حقق نتائج مقنعة جدا في الدقة و كانت.
97.
35%
Abstract EN
Printed Arabic document image retrieval is a very important and needed system for many applications including electronic archiving, search engines, and document management systems.
In this paper, an adaptive header-words based printed Arabic document images classification and retrieval system has been proposed that based on decision tree classifier improved by bagging technique.
The proposed system implements effective preprocessing and segmentation techniques to prepare the document and correctly detect a specific Arabic header words form query document.
Besides that, a collection of discriminative features has been extracted from detected header words to correctly classify them to a right class.
In the proposed system, bagging technique has been adapted with decision tree classifier to enhance the performance of classification and hence improve the precision of retrieving documents.
The experimental tests confirmed that the proposed system achieved very satisfied results of 97.
35% for precision.
American Psychological Association (APA)
Abd al-Munim, Mathil Imad al-Din& Abbas, Haytham Karim. 2019. Classification and retrieving printed Arabic document images based on bagged decision tree classifier. al-Mansour،Vol. 2019, no. 32, pp.14-33.
https://search.emarefa.net/detail/BIM-973887
Modern Language Association (MLA)
Abd al-Munim, Mathil Imad al-Din& Abbas, Haytham Karim. Classification and retrieving printed Arabic document images based on bagged decision tree classifier. al-Mansour No. 32 (2019), pp.14-33.
https://search.emarefa.net/detail/BIM-973887
American Medical Association (AMA)
Abd al-Munim, Mathil Imad al-Din& Abbas, Haytham Karim. Classification and retrieving printed Arabic document images based on bagged decision tree classifier. al-Mansour. 2019. Vol. 2019, no. 32, pp.14-33.
https://search.emarefa.net/detail/BIM-973887
Data Type
Journal Articles
Language
English
Notes
Includes bibliographical references : p. 31-32
Record ID
BIM-973887