Classification and retrieving printed Arabic document images based on bagged decision tree classifier

Other Title(s)

تصنيف و استرجاع الوثائق العربية المطبوعة بالاعتماد على المصنف شجرة القرار Bagged

Joint Authors

Abbas, Haytham Karim
Abd al-Munim, Mathil Imad al-Din

Source

al-Mansour

Issue

Vol. 2019, Issue 32 (31 Dec. 2019), pp.14-33, 20 p.

Publisher

al-Mansour University College

Publication Date

2019-12-31

Country of Publication

Iraq

No. of Pages

20

Main Subjects

Library Sciences

Topics

Abstract AR

إن استرجاع صورة الوثائق العربية المطبوعة هو نظام مهم جدا و مطلوب للعديد من التطبيقات بما في ذلك الأرشفة الإلكترونية و محركات البحث و أنظمة إدارة الوثائق.

في هذه البحث تم اقتراح نظام متكيف لتصنيف و استرجاع الوثائق العربية المطبوعة استنادا الى الكلمات الرأسية بالاعتماد على طريقة شجرة القرار (Decision Tree) التي تم تحسينها بواسطة تقنية.

Baggingيقوم النظام المقترح بتطبيق تقنيات المعالجة المسبقة و التجزئة الفعالة لإعداد الوثيقة و كشف الكلمات الرأسية من وثيقة الاستعلام و بالإضافة إلى ذلك، تم استخراج مجموعة من الميزات التمييزية من الكلمات الرأس المستخرجة لتصنيفها بشكل صحيح إلى الصنف الصحيح.

في النظام المقترح، تم تكييف تقنية Bagging مع المصنف شجرة القرار لتعزيز أداء التصنيف و بالتالي تحسين دقة استرجاع الوثائق.

اثبتت التجارب ان النظام المقترح حقق نتائج مقنعة جدا في الدقة و كانت.

97.

35%

Abstract EN

Printed Arabic document image retrieval is a very important and needed system for many applications including electronic archiving, search engines, and document management systems.

In this paper, an adaptive header-words based printed Arabic document images classification and retrieval system has been proposed that based on decision tree classifier improved by bagging technique.

The proposed system implements effective preprocessing and segmentation techniques to prepare the document and correctly detect a specific Arabic header words form query document.

Besides that, a collection of discriminative features has been extracted from detected header words to correctly classify them to a right class.

In the proposed system, bagging technique has been adapted with decision tree classifier to enhance the performance of classification and hence improve the precision of retrieving documents.

The experimental tests confirmed that the proposed system achieved very satisfied results of 97.

35% for precision.

American Psychological Association (APA)

Abd al-Munim, Mathil Imad al-Din& Abbas, Haytham Karim. 2019. Classification and retrieving printed Arabic document images based on bagged decision tree classifier. al-Mansour،Vol. 2019, no. 32, pp.14-33.
https://search.emarefa.net/detail/BIM-973887

Modern Language Association (MLA)

Abd al-Munim, Mathil Imad al-Din& Abbas, Haytham Karim. Classification and retrieving printed Arabic document images based on bagged decision tree classifier. al-Mansour No. 32 (2019), pp.14-33.
https://search.emarefa.net/detail/BIM-973887

American Medical Association (AMA)

Abd al-Munim, Mathil Imad al-Din& Abbas, Haytham Karim. Classification and retrieving printed Arabic document images based on bagged decision tree classifier. al-Mansour. 2019. Vol. 2019, no. 32, pp.14-33.
https://search.emarefa.net/detail/BIM-973887

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 31-32

Record ID

BIM-973887