Indexation automatique des textes : état de l’art

Other Title(s)

Automatic indexing of Arabic documents : state of the art

Joint Authors

al-Bazzi, Muhammad Salim
Zaki, Tahir
al-Naji, Abd al-Latif
Mammass, Idris

Source

e-TI

Issue

Vol. 2016, Issue 9 (31 Dec. 2016), pp.48-64, 17 p.

Publisher

Université Mohammed V-Agdal Ecole Mohammadia d’Ingénieurs

Publication Date

2016-12-31

Country of Publication

Morocco

No. of Pages

17

Main Subjects

Library Sciences

Abstract EN

Document indexing is a crucial step in the text mining process.

It is used to represent documents by the most relevant descriptors of their contents.

Several approaches are proposed in the literature, particularly for English, but they are unusable for Arabic documents, considering its specific characteristics and its morphological complexity, grammar and vocabulary.

In this paper, we present a reading in the state of the art of indexation methods and their contribution to improve Arabic document’s processing.

We also propose a categorization of works according to the most used approaches and methods for indexing textual documents.

We adopted a qualitative selection of papers and we retained papers approving notable indexation contributions and illustrating significant results.

Abstract FRE

L’indexation des documents est une phase cruciale dans le processus de fouille de textes.

Elle permet de représenter les documents par les descripteurs les plus pertinents vis-à-vis de leurs contenus.

À ce propos, plusieurs approches sont proposées dans la littérature, notamment pour l’anglais, mais elles sont inexploitables par les documents en langue arabe en raison de ses caractéristiques spécifiques, de sa richesse morphologique et grammaticale et de son vocabulaire.

Cet article dresse un état de l’art des méthodes d’indexation et de leurs apports à la langue arabe.

Nous proposons une catégorisation des travaux selon les approches et les méthodes les plus utilisées en indexation automatique de documents textuels.

Nous avons adopté une sélection qualitative des articles.

Ainsi, avons-nous retenu les travaux constituant des contributions significatives au niveau de l’indexation et présentant des résultats considérables

American Psychological Association (APA)

al-Bazzi, Muhammad Salim& Zaki, Tahir& Mammass, Idris& al-Naji, Abd al-Latif. 2016. Indexation automatique des textes : état de l’art. e-TI،Vol. 2016, no. 9, pp.48-64.
https://search.emarefa.net/detail/BIM-733601

Modern Language Association (MLA)

al-Bazzi, Muhammad Salim…[et al.]. Indexation automatique des textes : état de l’art. e-TI No. 9 (2016), pp.48-64.
https://search.emarefa.net/detail/BIM-733601

American Medical Association (AMA)

al-Bazzi, Muhammad Salim& Zaki, Tahir& Mammass, Idris& al-Naji, Abd al-Latif. Indexation automatique des textes : état de l’art. e-TI. 2016. Vol. 2016, no. 9, pp.48-64.
https://search.emarefa.net/detail/BIM-733601

Data Type

Journal Articles

Language

French

Notes

Includes bibliographical references : p. 61-64

Record ID

BIM-733601