التعرف على النص العربي المطبوع باستخدام نموذج ماركوف الخفي

Joint Authors

الطالب، غيداء عبد العزيز
حسون، ارمانيسة نعمان

Source

مجلة الرافدين لعلوم الحاسبات و الرياضيات

Issue

Vol. 7, Issue 2 (31 Oct. 2010), pp.173-188, 16 p.

Publisher

University of Mosul College of Computer Science and Mathematics

Publication Date

2010-10-31

Country of Publication

Iraq

No. of Pages

16

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

التعرف الآلي على النص المطبوع له أهمية كبيرة في تطبيقات تكنولوجيا المعلومات الحديثة.

فالتعرف على النص المكتوب باللغة اللاتينية تم استخدامه منذ فترة طويلة.

أما بالنسبة للغات المكتوبة بأحرف متصلة (كاللغة العربية) فإن نظام التعرف على النص غير متوفر كنظام قوي موثوق في أدائه.

فما يزال هناك متسع للتحسينات فيما يتعلق بتخفيض معدل الكلمات الخاطئة، فضلاً عن عدم التقيد بحصيلة لغوية معينة.

لقد جُربت عدة مناهج في مجال التعرف على النص، و يبدو أن التعرف على النص العربي القائم على نموذج ماركوف الخفي هو الأكثر وعداً و ذلك بسبب قدرته على تمييز الكتابة المتصلة.

نُقدم في هذا البحث نظام يعمل بأسلوب off-line للتعرف على النص العربي المطبوع باستخدام نموذج ماركوف الخفي مع الاستعانة بخوارزمية تقطيع السطر النصي إلى مقاطع ثم حروف.

حقق النظام المقترح نسبة إنجاز قدرها (94.9 %) و هي نسبة تقع ضمن بحوث التعرف المنجزة، و تبقى هذه النسبة قابلة للتحسين.

استخدمت Matlab V7.6 (R2008a)كلغة برمجية في بناء النظام المقترح.

Abstract EN

Automatic recognition of printed text is of high importance in modern IT applications.

Recognition of text for lateen scripted language is readily in use for a long time.

For cursive script languages (such as Arabic language) recognition of text is not available as a robust one with a reliable performance.

More improvements sttill exist to reduce average of incorrect words, rather then no constrains on the limit of words of a specific language.

Numerous approaches were tried in recognition of text but recognition of Arabic text based on Hidden Markov model seems to be the most promising one because of its abilitty to discriminate cursive scripts.

This paper provides an off-line system ¬to recognize printed Arabic text by using hidden Markov model with the aid of the algorithm that segment t he text lines into connected pars then into characters.

By looking on the results given by the designed recognition system it is found that a recognition rate (94.9 %) can be achieved.

Such rate is in the same order of rates of recognition researches viewed in previous studies.

This rate can still be improved.

The language used in building the system is Matlab V.

7.6 (R2008a).

American Psychological Association (APA)

الطالب، غيداء عبد العزيز وحسون، ارمانيسة نعمان. 2010. التعرف على النص العربي المطبوع باستخدام نموذج ماركوف الخفي. مجلة الرافدين لعلوم الحاسبات و الرياضيات،مج. 7، ع. 2، ص ص. 173-188.
https://search.emarefa.net/detail/BIM-253453

Modern Language Association (MLA)

الطالب، غيداء عبد العزيز وحسون، ارمانيسة نعمان. التعرف على النص العربي المطبوع باستخدام نموذج ماركوف الخفي. مجلة الرافدين لعلوم الحاسبات و الرياضيات مج. 7, ع. 2 (2010)، ص ص. 173-188.
https://search.emarefa.net/detail/BIM-253453

American Medical Association (AMA)

الطالب، غيداء عبد العزيز وحسون، ارمانيسة نعمان. التعرف على النص العربي المطبوع باستخدام نموذج ماركوف الخفي. مجلة الرافدين لعلوم الحاسبات و الرياضيات. 2010. مج. 7، ع. 2، ص ص. 173-188.
https://search.emarefa.net/detail/BIM-253453

Data Type

Journal Articles

Language

Arabic

Notes

يتضمن مراجع ببليوجرافية : ص. 187-188

Record ID

BIM-253453