A discrete arabic script for better automatic document understanding

المؤلف

Abu Haybah, Ibrahim S. I.

المصدر

The Arabian Journal for Science and Engineering. Section B, Engineering

العدد

المجلد 28، العدد 1B (30 إبريل/نيسان 2003)، ص ص. 77-94، 18ص.

الناشر

جامعة الملك فهد للبترول و المعادن

تاريخ النشر

2003-04-30

دولة النشر

السعودية

عدد الصفحات

18

التخصصات الرئيسية

الهندسة الكهربائية

الموضوعات

الملخص AR

يضع هذا البحث الأساس لتطوير خطوط جديدة تستعمل في كتابة النصوص العربية بحروف منفصلة.

هذه الخطوط تساعد على الفهم الآلي للمستندات و يمكن أن تستعمل في طباعة الكتب، و الجرائد، و الدوريات، و كل المواد الأخرى المطبوعة.

و بالطبع فإن كل الخصائص الأخرى للكتابة العربية تبقى كما هي عند إنتاج مثل هذه الخطوط.

و بالمرور على ما حدث للخط العربي منذ نشأته نقدم حجة قوية تدعم دعوتنا لكتابة النصوص العربية بحروف منفصلة.

لقد تمكنا من تطوير خطوط عربية جديدة للكتابة بحروف منفصلة بحيث يمكن فصل هذه الحروف بقصات بيضاء رأسية.

و قد تمت دراسة عاملين بما يناسب المتطلبات الجديدة : الفراغان على يسار الحرف و يمينه.

و قد استخدمنا تسع صفحات A4 للوصول إلى قيم مناسبة لهذه الفراغات فكانت النتيجة أن خطا ذا فراغ مقداره 160 وحدة خطوط على يسار الحرف و يمينه قد حقق نجاحا يعادل 99.99 % في فصل الحروف.

الملخص EN

This paper lays the groundwork for the development of new fonts to produce discrete Arabic script, for the first time, instead of cursive Arabic script.

These fonts help in automatic document understanding and can be used to print books, newspapers, periodicals, and all other printed materials.

Of course, all other properties of Arabic writing system are preserved when producing such fonts.

The history of Arabic calligraphy since its beginning provides a strong defense of our call to break the cursive law of Arabic script.

We could develop new fonts for discrete Arabic typography such that the characters can be segmented with simple vertical white cuts.

Two parameters are investigated to suit the new requirements: left and right white spaces.

Nine A4 pages of Arabic script were used in our experiments to empirically determine a sufficient amount of these spaces.

A font with left and right spaces of 160 FUnits each, achieved a segmentation success rate of 99.99%.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Abu Haybah, Ibrahim S. I.. 2003. A discrete arabic script for better automatic document understanding. The Arabian Journal for Science and Engineering. Section B, Engineering،Vol. 28, no. 1B, pp.77-94.
https://search.emarefa.net/detail/BIM-360000

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Abu Haybah, Ibrahim S. I.. A discrete arabic script for better automatic document understanding. The Arabian Journal for Science and Engineering. Section B, Engineering Vol. 28, no. 1B (Apr. 2003), pp.77-94.
https://search.emarefa.net/detail/BIM-360000

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Abu Haybah, Ibrahim S. I.. A discrete arabic script for better automatic document understanding. The Arabian Journal for Science and Engineering. Section B, Engineering. 2003. Vol. 28, no. 1B, pp.77-94.
https://search.emarefa.net/detail/BIM-360000

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 93-94

رقم السجل

BIM-360000