A discrete arabic script for better automatic document understanding

Author

Abu Haybah, Ibrahim S. I.

Source

The Arabian Journal for Science and Engineering. Section B, Engineering

Issue

Vol. 28, Issue 1B (30 Apr. 2003), pp.77-94, 18 p.

Publisher

King Fahd University of Petroleum and Minerals

Publication Date

2003-04-30

Country of Publication

Saudi Arabia

No. of Pages

18

Main Subjects

Electronic engineering

Topics

Abstract AR

يضع هذا البحث الأساس لتطوير خطوط جديدة تستعمل في كتابة النصوص العربية بحروف منفصلة.

هذه الخطوط تساعد على الفهم الآلي للمستندات و يمكن أن تستعمل في طباعة الكتب، و الجرائد، و الدوريات، و كل المواد الأخرى المطبوعة.

و بالطبع فإن كل الخصائص الأخرى للكتابة العربية تبقى كما هي عند إنتاج مثل هذه الخطوط.

و بالمرور على ما حدث للخط العربي منذ نشأته نقدم حجة قوية تدعم دعوتنا لكتابة النصوص العربية بحروف منفصلة.

لقد تمكنا من تطوير خطوط عربية جديدة للكتابة بحروف منفصلة بحيث يمكن فصل هذه الحروف بقصات بيضاء رأسية.

و قد تمت دراسة عاملين بما يناسب المتطلبات الجديدة : الفراغان على يسار الحرف و يمينه.

و قد استخدمنا تسع صفحات A4 للوصول إلى قيم مناسبة لهذه الفراغات فكانت النتيجة أن خطا ذا فراغ مقداره 160 وحدة خطوط على يسار الحرف و يمينه قد حقق نجاحا يعادل 99.99 % في فصل الحروف.

Abstract EN

This paper lays the groundwork for the development of new fonts to produce discrete Arabic script, for the first time, instead of cursive Arabic script.

These fonts help in automatic document understanding and can be used to print books, newspapers, periodicals, and all other printed materials.

Of course, all other properties of Arabic writing system are preserved when producing such fonts.

The history of Arabic calligraphy since its beginning provides a strong defense of our call to break the cursive law of Arabic script.

We could develop new fonts for discrete Arabic typography such that the characters can be segmented with simple vertical white cuts.

Two parameters are investigated to suit the new requirements: left and right white spaces.

Nine A4 pages of Arabic script were used in our experiments to empirically determine a sufficient amount of these spaces.

A font with left and right spaces of 160 FUnits each, achieved a segmentation success rate of 99.99%.

American Psychological Association (APA)

Abu Haybah, Ibrahim S. I.. 2003. A discrete arabic script for better automatic document understanding. The Arabian Journal for Science and Engineering. Section B, Engineering،Vol. 28, no. 1B, pp.77-94.
https://search.emarefa.net/detail/BIM-360000

Modern Language Association (MLA)

Abu Haybah, Ibrahim S. I.. A discrete arabic script for better automatic document understanding. The Arabian Journal for Science and Engineering. Section B, Engineering Vol. 28, no. 1B (Apr. 2003), pp.77-94.
https://search.emarefa.net/detail/BIM-360000

American Medical Association (AMA)

Abu Haybah, Ibrahim S. I.. A discrete arabic script for better automatic document understanding. The Arabian Journal for Science and Engineering. Section B, Engineering. 2003. Vol. 28, no. 1B, pp.77-94.
https://search.emarefa.net/detail/BIM-360000

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 93-94

Record ID

BIM-360000