Design algorithm for text and figures separating from printed image document

Author

Yasin, Ali Adil

Source

Journal of Basrah Researches : Sciences

Issue

Vol. 33, Issue 2A (30 Jun. 2007), pp.122-128, 7 p.

Publisher

University of Basrah College of Education for Pure Sciences

Publication Date

2007-06-30

Country of Publication

Iraq

No. of Pages

7

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

يهدف هذا البحث إلى إنشاء خوارزمية لها القابلية على فصل الأشكال ذات التدرجات الرمادية المختلفة عن وثيقة تحتوي على مجموعة من النصوص.

أساس عمل هذه الخوارزمية إنها سوف تتعامل مع الوثيقة على كونها صورة ثم بعد ذلك فصل كافة الأشكال ذات التدرجات الرمادية المختلفة عن اللون المكتوب فيه النص، لكن ما واجهناه من صعوبات هو إن بعض الأشكال تحتوي على تدرجات رمادية تكون قريبة من التدرجات الرمادية التي تكون ممزوجة مع بعض خطوط النصوص حيث إن الخط لا يكون باللون الأسود المطلق بل يحتوي في كثير من جوانبه على الألوان رمادية.

الخوارزمية سوف تقوم بإنشاء جدول يتكون من حقلين الأول التدرجات الرمادية في الوثيقة و الثاني عدد مرات تكرار كل لون في الوثيقة، الخوارزمية سوف تتعامل بذكاء في فصل اللون الأسود و الأبيض و اللون الذي يختلط مع النصوص بالكتابة ثم بعد ذلك تعزل كافة الألوان التي تتواجد ضمن تلك الأشكال و بالنهاية مخرجات هذه الخوارزمية وثيقتين الأولى تحتوي على كتابة فقط و الثانية تحتوي على الأشكال فقط.

Abstract EN

The aim of this research is to create algorithm that has ability to separate figures and texts which are exist in document.

The foundation of this algorithm, will deal with document as an image, then separate all figures which have many colors differ from the text color.

But there is an effective problem that we might be false, there is some gray-levels values, which be near from gray-levels that exist inside the error text, whereas the error doesn't contain on black color absolutely.

Algorithm will make table consist of two fields ; the first, the colors which exist in document, and the second number repetition for each color in document, algorithm will deal in intelligence with separate white, black colors and color (gray-levels) that mixed with texts in the writing, after that insulate all gray-levels which exist in the figures.

At the final the outputs of algorithm are two documents : The first, contains only writing (texts) and the second contains figures without making some distortion on writing documents.

American Psychological Association (APA)

Yasin, Ali Adil. 2007. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences،Vol. 33, no. 2A, pp.122-128.
https://search.emarefa.net/detail/BIM-382086

Modern Language Association (MLA)

Yasin, Ali Adil. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences Vol. 33, no. 2A (Jun. 2007), pp.122-128.
https://search.emarefa.net/detail/BIM-382086

American Medical Association (AMA)

Yasin, Ali Adil. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences. 2007. Vol. 33, no. 2A, pp.122-128.
https://search.emarefa.net/detail/BIM-382086

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 128

Record ID

BIM-382086