تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء

العناوين الأخرى

Design an optical recognition system for Arabic Braille scripts and convert it into readable text

مقدم أطروحة جامعية

جبر، زمن فاضل

مشرف أطروحة جامعية

زينت إبراهيم عثمان

أعضاء اللجنة

حمزة عباس علي
هند رستم محمد
عباس حنون حسن

الجامعة

جامعة البصرة

الكلية

كلية العلوم

القسم الأكاديمي

قسم علوم الحاسبات

دولة الجامعة

العراق

الدرجة العلمية

ماجستير

تاريخ الدرجة العلمية

2012

الملخص العربي

يهدف البحث إلى بناء نظام تمييز ضوئي لوثائق برايل العربي و تحميلها إلى نص مقروء.

الوثائق من نوع greade0 و ذات ألوان مخالفة و يعتمد النظام في عمله على مجموعة من الخطوات لغرض الوصول إلى الهدف المطلوب.

يتم إدخال الصور إلى النظام بواسطة الماسح الضوئي المسطح و بدقة مقدارها 100 dpi ثم تمر هذه الصور بمرحلة المعالجة الأولية و تتمثل هذه المعالجة بتحويل الصورة إلى التدرج الرمادي و إزالة الضوضاء الناتجة من مرحلة المسح الضوئي.

اقترحنا في هذا النظام خوارزميات تعتيب لصورة وثيقة برايل أسلوب عملها يعتمد على تطبيق Morphological Operations على الصوة لغرض تنعيمها و تعويض مشكلة الإضاءة غير المنتظمة فيها و المتسبب بها طبيعة وثائق برايل و البروزات المكونة للحروف فيها و تضمنت هذه العلميات تطبيق Morphological Top-hat Filter على صور وثائق برايل ذات اللون الأخضر و Morphological Bottom-hat Filter على صور وثائق برايل ذات اللون الأصفر.

بعد أن اكتمل تنعيم الصورة تنتقل الخوارزميات المقترحة إلى تطبيق تقنيات التعتيب المتمثلة باستخدام Iterative, Adaptive thresholding لغرض تميل صور وثائق برايل إلى صيغة الصوة الثنائية، إذ تم استخدام Iterative procedure لإيجاد حد عتبة عام لصوة وثيقة يطيل ذات اللون الأخضر، كما تم استخدام تقنية Adaptive thresholding لإيجاد حد عتبة متوائم (متكيف) مع كل منطقة تحددها الخوارزمية فى صور وثائق برايل ذات اللون الأصفر و بالنتيجة سوف تمثل البروزات بالقيمة الثنائية 1 بينما الخلفية شف بالقيمة الثنائية 0.

أما مشكلة ميل الصوة فقد تم استخدام (Linear Regression Analysis Formula (LRA لإيجاد درجة الميل للصوة المدخلة و تم تحديد اتجاه الميل بالاعتماد على أول و آخر عنصر في السطر الأول الذي يحتوي بروزات من الصوة حيث يتم التدوير للصورة بعكس اتجاه الميل المستحرج و بمقدار الزاوية التي تحددها LRA.

و بذلك أصبحت الصورة مهيأة لمرحلة تحليل المكونات المتصلة Connected Component Analysis و التي تهدف إلى استخراج الخصائص المتصلة لكل حرف في وثيقة برايل.

تم اقتراح خوارزميات تقطيع جديدة للصورة لغرض فصل الأسطر و الكلمات و الحروف إذ تقوم هذه الخوارزميات بعملية تقطيع الصوة إلى أسطر باستخدام الإسقاط الأفقي Horizontal Projection للصوة و من ثم تقطيع السطور الناتجة إلى كلمات باستخدام الإسقاط العمودي Vertical Projection لتلك للسطور أيضا تم تقطيع الكلمات إلى الحروف المكونة لها باستخدام الإسقاط العمودي في تلك الكلمات.

في المرحلة الأخيرة، أجريت عملية التمييز لخلايا برايل باستخدام تقنية Template Matching و بذلك تستحرج ASCII الخاص بكل حرف عربي و الذي يقابل كل خلية من خلايا برايل.

و أعطى النظام بعد أن طبق على 137 صورة لوثائق برايل العربي نسب تمييز واعدة تراوحت بين (00ا %-98.04 %) تم الحصول عليها من 76 وثيقة من وثائق برايل ذات اللون الأخضر (%99.6- 97.08 %) تم الحصول عليها من 61 وثيقة من وثائق بريل ذات اللون الأصفر.

و بعد توليد النص تم تسليط قارئ النصوص Acapela Multimedia TTS عليه لتحويله إلى صوت (نص مقروء)) حيث كانت سرعة المعالج المستخدم (2 GHz) أما الذاكرة (RAM) كانت بحجم (4 GB)، و تمت برمجة النظام باستخدام لغة ماتلاب (Matlab).

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

عدد الصفحات

102

قائمة المحتويات

فهرس المحتويات / الموضوعات.

الملخص / المستخلص.

المستخلص باللغة الإنجليزية.

الفصل الأول : مقدمة عن نظام برايل.

الفصل الثاني : تقنيات معالجة صور الوثائق.

الفصل الثالث : نظام تمييز برايل المقترح و تطبيقاته.

الفصل الرابع : الاستنتاجات و الأعمال المستقبلية.

قائمة المراجع.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

جبر، زمن فاضل. (2012). تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء. (أطروحة ماجستير). جامعة البصرة, العراق
https://search.emarefa.net/detail/BIM-317416

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

جبر، زمن فاضل. تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء. (أطروحة ماجستير). جامعة البصرة. (2012).
https://search.emarefa.net/detail/BIM-317416

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

جبر، زمن فاضل. (2012). تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء. (أطروحة ماجستير). جامعة البصرة, العراق
https://search.emarefa.net/detail/BIM-317416

لغة النص

العربية

نوع البيانات

رسائل جامعية

رقم السجل

BIM-317416