تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء
Other Title(s)
Design an optical recognition system for Arabic Braille scripts and convert it into readable text
Dissertant
Thesis advisor
Comitee Members
حمزة عباس علي
هند رستم محمد
عباس حنون حسن
University
University of Basrah
Faculty
Science College
Department
Department of Computer Science
University Country
Iraq
Degree
Master
Degree Date
2012
Arabic Abstract
يهدف البحث إلى بناء نظام تمييز ضوئي لوثائق برايل العربي و تحميلها إلى نص مقروء.
الوثائق من نوع greade0 و ذات ألوان مخالفة و يعتمد النظام في عمله على مجموعة من الخطوات لغرض الوصول إلى الهدف المطلوب.
يتم إدخال الصور إلى النظام بواسطة الماسح الضوئي المسطح و بدقة مقدارها 100 dpi ثم تمر هذه الصور بمرحلة المعالجة الأولية و تتمثل هذه المعالجة بتحويل الصورة إلى التدرج الرمادي و إزالة الضوضاء الناتجة من مرحلة المسح الضوئي.
اقترحنا في هذا النظام خوارزميات تعتيب لصورة وثيقة برايل أسلوب عملها يعتمد على تطبيق Morphological Operations على الصوة لغرض تنعيمها و تعويض مشكلة الإضاءة غير المنتظمة فيها و المتسبب بها طبيعة وثائق برايل و البروزات المكونة للحروف فيها و تضمنت هذه العلميات تطبيق Morphological Top-hat Filter على صور وثائق برايل ذات اللون الأخضر و Morphological Bottom-hat Filter على صور وثائق برايل ذات اللون الأصفر.
بعد أن اكتمل تنعيم الصورة تنتقل الخوارزميات المقترحة إلى تطبيق تقنيات التعتيب المتمثلة باستخدام Iterative, Adaptive thresholding لغرض تميل صور وثائق برايل إلى صيغة الصوة الثنائية، إذ تم استخدام Iterative procedure لإيجاد حد عتبة عام لصوة وثيقة يطيل ذات اللون الأخضر، كما تم استخدام تقنية Adaptive thresholding لإيجاد حد عتبة متوائم (متكيف) مع كل منطقة تحددها الخوارزمية فى صور وثائق برايل ذات اللون الأصفر و بالنتيجة سوف تمثل البروزات بالقيمة الثنائية 1 بينما الخلفية شف بالقيمة الثنائية 0.
أما مشكلة ميل الصوة فقد تم استخدام (Linear Regression Analysis Formula (LRA لإيجاد درجة الميل للصوة المدخلة و تم تحديد اتجاه الميل بالاعتماد على أول و آخر عنصر في السطر الأول الذي يحتوي بروزات من الصوة حيث يتم التدوير للصورة بعكس اتجاه الميل المستحرج و بمقدار الزاوية التي تحددها LRA.
و بذلك أصبحت الصورة مهيأة لمرحلة تحليل المكونات المتصلة Connected Component Analysis و التي تهدف إلى استخراج الخصائص المتصلة لكل حرف في وثيقة برايل.
تم اقتراح خوارزميات تقطيع جديدة للصورة لغرض فصل الأسطر و الكلمات و الحروف إذ تقوم هذه الخوارزميات بعملية تقطيع الصوة إلى أسطر باستخدام الإسقاط الأفقي Horizontal Projection للصوة و من ثم تقطيع السطور الناتجة إلى كلمات باستخدام الإسقاط العمودي Vertical Projection لتلك للسطور أيضا تم تقطيع الكلمات إلى الحروف المكونة لها باستخدام الإسقاط العمودي في تلك الكلمات.
في المرحلة الأخيرة، أجريت عملية التمييز لخلايا برايل باستخدام تقنية Template Matching و بذلك تستحرج ASCII الخاص بكل حرف عربي و الذي يقابل كل خلية من خلايا برايل.
و أعطى النظام بعد أن طبق على 137 صورة لوثائق برايل العربي نسب تمييز واعدة تراوحت بين (00ا %-98.04 %) تم الحصول عليها من 76 وثيقة من وثائق برايل ذات اللون الأخضر (%99.6- 97.08 %) تم الحصول عليها من 61 وثيقة من وثائق بريل ذات اللون الأصفر.
و بعد توليد النص تم تسليط قارئ النصوص Acapela Multimedia TTS عليه لتحويله إلى صوت (نص مقروء)) حيث كانت سرعة المعالج المستخدم (2 GHz) أما الذاكرة (RAM) كانت بحجم (4 GB)، و تمت برمجة النظام باستخدام لغة ماتلاب (Matlab).
Main Subjects
Information Technology and Computer Science
Topics
No. of Pages
102
Table of Contents
فهرس المحتويات / الموضوعات.
الملخص / المستخلص.
المستخلص باللغة الإنجليزية.
الفصل الأول : مقدمة عن نظام برايل.
الفصل الثاني : تقنيات معالجة صور الوثائق.
الفصل الثالث : نظام تمييز برايل المقترح و تطبيقاته.
الفصل الرابع : الاستنتاجات و الأعمال المستقبلية.
قائمة المراجع.
American Psychological Association (APA)
جبر، زمن فاضل. (2012). تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء. (أطروحة ماجستير). جامعة البصرة, العراق
https://search.emarefa.net/detail/BIM-317416
Modern Language Association (MLA)
جبر، زمن فاضل. تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء. (أطروحة ماجستير). جامعة البصرة. (2012).
https://search.emarefa.net/detail/BIM-317416
American Medical Association (AMA)
جبر، زمن فاضل. (2012). تصميم نظام تمييز ضوئي لمخطوطات برايل العربي و تحويلها إلى نص مقروء. (أطروحة ماجستير). جامعة البصرة, العراق
https://search.emarefa.net/detail/BIM-317416
Language
Arabic
Data Type
Arab Theses
Record ID
BIM-317416