Recognition of the Script in Serbian Documents Using Frequency Occurrence and Co-Occurrence Analysis
المؤلفون المشاركون
Brodić, Darko
Milivojević, Zoran N.
Maluckov, Čedomir A.
المصدر
العدد
المجلد 2013، العدد 2013 (31 ديسمبر/كانون الأول 2013)، ص ص. 1-14، 14ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2013-12-10
دولة النشر
مصر
عدد الصفحات
14
التخصصات الرئيسية
الطب البشري
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
Any document in Serbian language can be written in two different scripts: Latin or Cyrillic.
Although characteristics of these scripts are similar, some of their statistical measures are quite different.
The paper proposed a method for the extraction of certain script from document according to the occurrence and co-occurrence of the script types.
First, each letter is modeled with the certain script type according to characteristics concerning its position in baseline area.
Then, the frequency analysis of the script types occurrence is performed.
Due to diversity of Latin and Cyrillic script, the occurrence of modeled letters shows substantial statistics dissimilarity.
Furthermore, the co-occurrence matrix is computed.
The analysis of the co-occurrence matrix draws a strong margin as a criteria to distinguish and recognize the certain script.
The proposed method is analyzed on the case of a database which includes different types of printed and web documents.
The experiments gave encouraging results.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Brodić, Darko& Milivojević, Zoran N.& Maluckov, Čedomir A.. 2013. Recognition of the Script in Serbian Documents Using Frequency Occurrence and Co-Occurrence Analysis. The Scientific World Journal،Vol. 2013, no. 2013, pp.1-14.
https://search.emarefa.net/detail/BIM-1033414
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Brodić, Darko…[et al.]. Recognition of the Script in Serbian Documents Using Frequency Occurrence and Co-Occurrence Analysis. The Scientific World Journal No. 2013 (2013), pp.1-14.
https://search.emarefa.net/detail/BIM-1033414
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Brodić, Darko& Milivojević, Zoran N.& Maluckov, Čedomir A.. Recognition of the Script in Serbian Documents Using Frequency Occurrence and Co-Occurrence Analysis. The Scientific World Journal. 2013. Vol. 2013, no. 2013, pp.1-14.
https://search.emarefa.net/detail/BIM-1033414
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1033414
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر