Design algorithm for text and figures separating from printed image document
Author
Source
Journal of Basrah Researches : Sciences
Issue
Vol. 33, Issue 2A (30 Jun. 2007), pp.122-128, 7 p.
Publisher
University of Basrah College of Education for Pure Sciences
Publication Date
2007-06-30
Country of Publication
Iraq
No. of Pages
7
Main Subjects
Information Technology and Computer Science
Topics
Abstract AR
يهدف هذا البحث إلى إنشاء خوارزمية لها القابلية على فصل الأشكال ذات التدرجات الرمادية المختلفة عن وثيقة تحتوي على مجموعة من النصوص.
أساس عمل هذه الخوارزمية إنها سوف تتعامل مع الوثيقة على كونها صورة ثم بعد ذلك فصل كافة الأشكال ذات التدرجات الرمادية المختلفة عن اللون المكتوب فيه النص، لكن ما واجهناه من صعوبات هو إن بعض الأشكال تحتوي على تدرجات رمادية تكون قريبة من التدرجات الرمادية التي تكون ممزوجة مع بعض خطوط النصوص حيث إن الخط لا يكون باللون الأسود المطلق بل يحتوي في كثير من جوانبه على الألوان رمادية.
الخوارزمية سوف تقوم بإنشاء جدول يتكون من حقلين الأول التدرجات الرمادية في الوثيقة و الثاني عدد مرات تكرار كل لون في الوثيقة، الخوارزمية سوف تتعامل بذكاء في فصل اللون الأسود و الأبيض و اللون الذي يختلط مع النصوص بالكتابة ثم بعد ذلك تعزل كافة الألوان التي تتواجد ضمن تلك الأشكال و بالنهاية مخرجات هذه الخوارزمية وثيقتين الأولى تحتوي على كتابة فقط و الثانية تحتوي على الأشكال فقط.
Abstract EN
The aim of this research is to create algorithm that has ability to separate figures and texts which are exist in document.
The foundation of this algorithm, will deal with document as an image, then separate all figures which have many colors differ from the text color.
But there is an effective problem that we might be false, there is some gray-levels values, which be near from gray-levels that exist inside the error text, whereas the error doesn't contain on black color absolutely.
Algorithm will make table consist of two fields ; the first, the colors which exist in document, and the second number repetition for each color in document, algorithm will deal in intelligence with separate white, black colors and color (gray-levels) that mixed with texts in the writing, after that insulate all gray-levels which exist in the figures.
At the final the outputs of algorithm are two documents : The first, contains only writing (texts) and the second contains figures without making some distortion on writing documents.
American Psychological Association (APA)
Yasin, Ali Adil. 2007. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences،Vol. 33, no. 2A, pp.122-128.
https://search.emarefa.net/detail/BIM-382086
Modern Language Association (MLA)
Yasin, Ali Adil. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences Vol. 33, no. 2A (Jun. 2007), pp.122-128.
https://search.emarefa.net/detail/BIM-382086
American Medical Association (AMA)
Yasin, Ali Adil. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences. 2007. Vol. 33, no. 2A, pp.122-128.
https://search.emarefa.net/detail/BIM-382086
Data Type
Journal Articles
Language
English
Notes
Includes bibliographical references : p. 128
Record ID
BIM-382086