Design algorithm for text and figures separating from printed image document

المؤلف

Yasin, Ali Adil

المصدر

Journal of Basrah Researches : Sciences

العدد

المجلد 33، العدد 2A (30 يونيو/حزيران 2007)، ص ص. 122-128، 7ص.

الناشر

جامعة البصرة كلية التربية للعلوم الصرفة

تاريخ النشر

2007-06-30

دولة النشر

العراق

عدد الصفحات

7

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

يهدف هذا البحث إلى إنشاء خوارزمية لها القابلية على فصل الأشكال ذات التدرجات الرمادية المختلفة عن وثيقة تحتوي على مجموعة من النصوص.

أساس عمل هذه الخوارزمية إنها سوف تتعامل مع الوثيقة على كونها صورة ثم بعد ذلك فصل كافة الأشكال ذات التدرجات الرمادية المختلفة عن اللون المكتوب فيه النص، لكن ما واجهناه من صعوبات هو إن بعض الأشكال تحتوي على تدرجات رمادية تكون قريبة من التدرجات الرمادية التي تكون ممزوجة مع بعض خطوط النصوص حيث إن الخط لا يكون باللون الأسود المطلق بل يحتوي في كثير من جوانبه على الألوان رمادية.

الخوارزمية سوف تقوم بإنشاء جدول يتكون من حقلين الأول التدرجات الرمادية في الوثيقة و الثاني عدد مرات تكرار كل لون في الوثيقة، الخوارزمية سوف تتعامل بذكاء في فصل اللون الأسود و الأبيض و اللون الذي يختلط مع النصوص بالكتابة ثم بعد ذلك تعزل كافة الألوان التي تتواجد ضمن تلك الأشكال و بالنهاية مخرجات هذه الخوارزمية وثيقتين الأولى تحتوي على كتابة فقط و الثانية تحتوي على الأشكال فقط.

الملخص EN

The aim of this research is to create algorithm that has ability to separate figures and texts which are exist in document.

The foundation of this algorithm, will deal with document as an image, then separate all figures which have many colors differ from the text color.

But there is an effective problem that we might be false, there is some gray-levels values, which be near from gray-levels that exist inside the error text, whereas the error doesn't contain on black color absolutely.

Algorithm will make table consist of two fields ; the first, the colors which exist in document, and the second number repetition for each color in document, algorithm will deal in intelligence with separate white, black colors and color (gray-levels) that mixed with texts in the writing, after that insulate all gray-levels which exist in the figures.

At the final the outputs of algorithm are two documents : The first, contains only writing (texts) and the second contains figures without making some distortion on writing documents.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Yasin, Ali Adil. 2007. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences،Vol. 33, no. 2A, pp.122-128.
https://search.emarefa.net/detail/BIM-382086

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Yasin, Ali Adil. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences Vol. 33, no. 2A (Jun. 2007), pp.122-128.
https://search.emarefa.net/detail/BIM-382086

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Yasin, Ali Adil. Design algorithm for text and figures separating from printed image document. Journal of Basrah Researches : Sciences. 2007. Vol. 33, no. 2A, pp.122-128.
https://search.emarefa.net/detail/BIM-382086

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 128

رقم السجل

BIM-382086