Finding the relevance degree between an English text and its title

Other Title(s)

إيجاد درجة الترابط بين نص إنكليزي و عنوانه

Joint Authors

Rahmah, Abd al-Munim Salih
Farhan, Ala Kazim
Kazim, Suhad M.

Source

Engineering and Technology Journal

Issue

Vol. 30, Issue 9 (31 Jan. 2012), pp.1625-1640, 16 p.

Publisher

University of Technology

Publication Date

2012-01-31

Country of Publication

Iraq

No. of Pages

16

Main Subjects

Languages & Comparative Literature

Topics

Abstract AR

إن الكلمات المفتاحية أداة مفيدة لأنها تعطي ملخصا قصيرا عن النص.

و هي مفيدة لمجالات عديدة كالتلخيص و الفهرسة و العنونة و التصنيف و في هذا البحث سوف نستخدم الكلمات المفتاحية من اجل معرفة درجة ترابط نص انكليزي بعنوانه.

لقد حل النظام المقترح هذه المشكلة من خلال طرق إحصائية (تكرار التعبير) و لغوية باستخلاص الكلمات المفتاحية للعنوان، و الكلمات المفتاحية للنص الانكليزي (مع تكرارهم داخل النص) و من ثم إيجاد معدل تكرار الكلمات المفتاحية للعنوان داخل النص و الذي يمثل درجة تعلق النص بعنوانه، و بالاعتماد على معجم للكلمات الغير مفتاحية و معجم للكلمات المرشحة لان تكون كلمات مفتاحية و لمجال معين (في بحثنا هذا تم اختيار مجال علوم الحاسوب).

هذا المعجم ممثل بهيكل شجري للكلمات الغير مفتاحية و هيكل شجري آخر للكلمات المفتاحية المرشحة، و لقد خزنت هذه الكلمات المفتاحية بطريقة تمنع التكرار لهذه التعابير أو أجزاء منها لتوفير كفاءة الخزن و لتقليل وقت البحث.

تم تنفيذ النظام المقترح باستخدام اللغة البرمجية المرئية 5.1 Visual Prolog و لقد اثبت النظام المقترح بعد اختباره بأنه قيم في إيجاد درجة الترابط بين نص و عنوانه (من وجهة نظر الدقة و وقت البحث).

Abstract EN

Keywords are useful tools as they give the shorter summary of the document.

Keywords are useful for a variety of purposes including summarizing, indexing, labeling, categorization, clustering, and searching, and in this paper we will use keywords in order to find the relevance degree between an English text and its title.

The proposed system solves this problem through simple statistic (Term frequency) and linguistic approaches by extracting the keywords of the title and keywords of the text (with their frequency that appear in the text) and finding the average of title's keywords frequency across the text that represent the relevance degree that required, with depending on a lexicon of a particular field (in this work we choose computer science field).

This lexicon is represented using two different B+ trees one for non-keywords and the other for candidate keywords, these keywords was stored in a manner that prevent redundancy of these terms or even sub-terms to provide efficient memory usage and to minimize the search time.

The proposed system was implemented using Visual Prolog 5.1 and after testing, it proved to be valuable for finding the degree of relevance between a text and its title (from point of view of accuracy and search time).

American Psychological Association (APA)

Rahmah, Abd al-Munim Salih& Kazim, Suhad M.& Farhan, Ala Kazim. 2012. Finding the relevance degree between an English text and its title. Engineering and Technology Journal،Vol. 30, no. 9, pp.1625-1640.
https://search.emarefa.net/detail/BIM-300900

Modern Language Association (MLA)

Rahmah, Abd al-Munim Salih…[et al.]. Finding the relevance degree between an English text and its title. Engineering and Technology Journal Vol. 30, no. 9 (2012), pp.1625-1640.
https://search.emarefa.net/detail/BIM-300900

American Medical Association (AMA)

Rahmah, Abd al-Munim Salih& Kazim, Suhad M.& Farhan, Ala Kazim. Finding the relevance degree between an English text and its title. Engineering and Technology Journal. 2012. Vol. 30, no. 9, pp.1625-1640.
https://search.emarefa.net/detail/BIM-300900

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 1640

Record ID

BIM-300900