L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation

Joint Authors

Rosso, Paolo
Outahajala, Muhammad
Benajiba, Yasin
Zenkouar, Lahbib

Source

e-TI

Issue

Vol. 2012, Issue 6 (31 Dec. 2012), pp.48-61, 14 p.

Publisher

Université Mohammed V-Agdal Ecole Mohammadia d’Ingénieurs

Publication Date

2012-12-31

Country of Publication

Morocco

No. of Pages

14

Main Subjects

Languages & Comparative Literature

Topics

Abstract FRE

L’objectif de cet article est de présenter le premier étiqueteur grammatical amazighe.

Très peu de ressources ont été développées pour l’amazighe et nous croyons que le développement d’un outil d’étiquetage grammatical est une étape préalable au traitement automatique de textes.

Afin d'atteindre cet objectif, nous avons formé deux modèles de classification de séquences en utilisant les SVMs, séparateurs à vaste marge (Support Vector Machines) et les CRFs, champs markoviens conditionnels (Conditional Random Fields) en utilisant une phase de segmentation.

Nous avons utilisé la technique de 10 fois la validation croisée pour évaluer notre approche.

Les résultats montrent que les performances des SVMs et des CRFs sont très comparables.

Dans l'ensemble, les SVMs ont légèrement dépassé les CRFs au niveau des échantillons (92,58 % contre 92,14 %) et la moyenne de précision des CRFs dépasse celle des SVMs (89,48 % contre 89,29 %).

Ces résultats sont très prometteurs étant donné que nous avons utilisé un corpus de seulement~20k mots.

American Psychological Association (APA)

Outahajala, Muhammad& Benajiba, Yasin& Rosso, Paolo& Zenkouar, Lahbib. 2012. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI،Vol. 2012, no. 6, pp.48-61.
https://search.emarefa.net/detail/BIM-337259

Modern Language Association (MLA)

Outahajala, Muhammad…[et al.]. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI No. 6 (2012), pp.48-61.
https://search.emarefa.net/detail/BIM-337259

American Medical Association (AMA)

Outahajala, Muhammad& Benajiba, Yasin& Rosso, Paolo& Zenkouar, Lahbib. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI. 2012. Vol. 2012, no. 6, pp.48-61.
https://search.emarefa.net/detail/BIM-337259

Data Type

Journal Articles

Language

French

Notes

Includes bibliographical references : p. 60-61

Record ID

BIM-337259