A survey study on relation extraction for web pages

Other Title(s)

دراسة مسحية لاستخراج العلاقة من صفحات الويب

Joint Authors

al-Sayigh, Ghadah Abd al-Karim
Taqa, Ala Yasin Taha
al-Talib, Ghayda A. A.

Source

al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah

Issue

Vol. 29, Issue 1 (31 Mar. 2020), pp.253-265, 13 p.

Publisher

University of Mosul College of Education for Pure Science

Publication Date

2020-03-31

Country of Publication

Iraq

No. of Pages

13

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

اللغة الطبيعية تعني اللغة التي يستخدمها الإنسان للتواصل.

تساعد معالجة اللغات الطبيعية (NLP) الآلات على فهم اللغة الطبيعية.

تتكون اللغة الطبيعية لصفحات الويب من العديد من العلاقات الدلالية بين الكيانات.

يعد اكتشاف أنواع مهمة من العلاقات من الويب تحديا صعبا بسبب طبيعة الويب المفتوحة.

في هذا البحث ، تم مسح عدة أنواع مهمة من العلاقات الدلالية كما يتناول البحث أيضا أساليب استخراج العلاقة (RE) التي تنقسم إلى : أسلوب خاضع للإشراف، و الذي يحتوي على قاعدة الميزات و قاعدة البذرة، و الأسلوب غير الخاضع للإشراف و الذي تم فيه مناقشة ثلاث خوارزميات لاستخراج العلاقة : دعم ناقل الماكينة (SVM) ، الخوارزمية الجينية و مصنف Naive Bayesيعد هذا البحث نافعا لثلاثة أنواع من القراء أولا الوافدين الجدد في هذا المجال الذين يريدون أن يتعلموا بسرعة موضوع استخراج العلاقة.

ثانيا، الباحثون الذين يريدون أن يعرفوا كيف تطورت أساليب استخراج العلاقة المختلفة مع مرور الوقت.

ثالثا ، المدربين الذين يحتاجون فقط إلى معرفة تقنية استخراج العلاقة التي تعمل بشكل أفضل في بيئات مختلفة

Abstract EN

Natural language means a language that is used for communication by human.

Natural Language Processing (NLP) helps machines to understand the natural language.

The natural language for the web pages consists of many semantic relations between entities.

Discovering significant types of relations from the web is challenging because of its open nature.

In this paper we survey several important types of semantic relations.

This paper also covers the relation extraction (RE) approaches which are divided into: supervised approach, which contains Feature base and Kernel base, and the unsupervised approach.

Three relation extraction algorithms are discussed: Support Vector Machine (SVM), Genetic algorithm and Naive Bayes classifierThis survey would be useful for three kinds of readers First the Newcomers in the field who want to quickly learn about relation extraction.

Second the researchers who want to know how the various relation extraction techniques developed over time.

Third the trainers who just need to know which RE technique works best in different settings

American Psychological Association (APA)

al-Sayigh, Ghadah Abd al-Karim& al-Talib, Ghayda A. A.& Taqa, Ala Yasin Taha. 2020. A survey study on relation extraction for web pages. al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah،Vol. 29, no. 1, pp.253-265.
https://search.emarefa.net/detail/BIM-1335722

Modern Language Association (MLA)

al-Sayigh, Ghadah Abd al-Karim…[et al.]. A survey study on relation extraction for web pages. al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah Vol. 29, no. 1 (2020), pp.253-265.
https://search.emarefa.net/detail/BIM-1335722

American Medical Association (AMA)

al-Sayigh, Ghadah Abd al-Karim& al-Talib, Ghayda A. A.& Taqa, Ala Yasin Taha. A survey study on relation extraction for web pages. al-Tarbiyah wa-al-Ilm : Majallat ilmiyah lil-Buhuth al-Ilmiyah al-Asasiyah. 2020. Vol. 29, no. 1, pp.253-265.
https://search.emarefa.net/detail/BIM-1335722

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 264-265

Record ID

BIM-1335722