Genetic based optimization models for enhancing multi-document text summarization
العناوين الأخرى
التلخيص الاقتطاعي للمستندات النصية المتعددة باستخدام نماذج أمثليه مستندة على الخوارزمية الجينية
المؤلفون المشاركون
Kazim, Nisrin J.
Salih, Hilal Hadi
المصدر
Engineering and Technology Journal
العدد
المجلد 33، العدد 8B (31 أغسطس/آب 2015)، ص ص. 1374-1387، 14ص.
الناشر
تاريخ النشر
2015-08-31
دولة النشر
العراق
عدد الصفحات
14
التخصصات الرئيسية
الملخص AR
التلخيص الاقتطاعي للمستندات النصية المتعددة – تلخيص يھدف إلى إزالة البيانات المتكررة بمجموعة مستندات مع الحفاظ على الجمل المھمة التي تبرز المحور الرئيسي الذي تدور حوله ھذه المستندات – حصل مؤخرا على اھتمام واسع من خلال اقتراح نماذج رياضية أوتوماتيكية لصياغة ھذه المشكلة.
ھذا البحث يقوم باقتراح نموذجين للتلخيص الاقتطاعي مستند على الخوارزمية الجينية.
حيث تم أوال وصف و نمذجة المشكلة كمشكلة أفضلية متقطعة عن طريق نموذجين مع تصميم دالة ملائمة محددة لكل نموذج مقترح.
و الثاني ھو استخدام تمثيل ثنائي مع موجه طفرة و مصحح محلي لمساعدة الخوارزمية الجينية المتبناة.
تم تبني دور درجة التشابه بين كل جملة مع باقي الجمل في مجموعة المستندات النصية و التشابه بين كل جملة و مركز مجموعة المستندات النصية و التشابه بين مركز المختصر و مركز مجموعة المستندات النصية في النماذج المقترحة.
التجارب طبقت على عشرة محاور من مجموعة البيانات العالمية DUC2002 و قد أظھرت النتائج فعالية النماذج المقترحة عندما تمت مقارنتھا مع أحد النماذج الحديثة.
أظھرت عملية حقن مستويات متعددة من مقياس التشابه النصي عند صياغة النموذج تأثير ايجابي على تحسين الأداء الكلي للخوارزمية الجينية المقترحة.
الملخص EN
Extractive multi-document text summarization – a summarization with the aim of removing redundant information in a document collection while preserving its salient sentences-has recently enjoyed a large interest in proposing automatic models.
This paper proposes two models for extractive multi-document summarization based on genetic algorithm (GA).
First, the problem is described and modeled as a discrete optimization problem with two candidate expressions and a specific fitness function is designed to effectively cope with each candidate.
Then, a binary-encoded representation together with a heuristic mutation and a local repair operator are proposed to characterize the adopted GA.
The semantic roles of similarity of sentence to sentence, sentence to center of document collection and center of summary to center of document collection are exploited in the proposed model formulations.
Experiments are applied to ten clusters from DUC2002 datasets (d061j through d070f) and compared with another state-of-the-art model.
Results clarify the effectiveness of the proposed models.
Moreover, the injection of several levels of text similarity in the model formulation shows a positive impact on enhancing the overall performance of the proposed GA.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Salih, Hilal Hadi& Kazim, Nisrin J.. 2015. Genetic based optimization models for enhancing multi-document text summarization. Engineering and Technology Journal،Vol. 33, no. 8B, pp.1374-1387.
https://search.emarefa.net/detail/BIM-674640
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Salih, Hilal Hadi& Kazim, Nisrin J.. Genetic based optimization models for enhancing multi-document text summarization. Engineering and Technology Journal Vol. 33, no. 8B (2015), pp.1374-1387.
https://search.emarefa.net/detail/BIM-674640
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Salih, Hilal Hadi& Kazim, Nisrin J.. Genetic based optimization models for enhancing multi-document text summarization. Engineering and Technology Journal. 2015. Vol. 33, no. 8B, pp.1374-1387.
https://search.emarefa.net/detail/BIM-674640
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Text in English ; abstracts in English and Arabic.
رقم السجل
BIM-674640
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر