L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation
Joint Authors
Rosso, Paolo
Outahajala, Muhammad
Benajiba, Yasin
Zenkouar, Lahbib
Source
Issue
Vol. 2012, Issue 6 (31 Dec. 2012), pp.48-61, 14 p.
Publisher
Université Mohammed V-Agdal Ecole Mohammadia d’Ingénieurs
Publication Date
2012-12-31
Country of Publication
Morocco
No. of Pages
14
Main Subjects
Languages & Comparative Literature
Topics
Abstract FRE
L’objectif de cet article est de présenter le premier étiqueteur grammatical amazighe.
Très peu de ressources ont été développées pour l’amazighe et nous croyons que le développement d’un outil d’étiquetage grammatical est une étape préalable au traitement automatique de textes.
Afin d'atteindre cet objectif, nous avons formé deux modèles de classification de séquences en utilisant les SVMs, séparateurs à vaste marge (Support Vector Machines) et les CRFs, champs markoviens conditionnels (Conditional Random Fields) en utilisant une phase de segmentation.
Nous avons utilisé la technique de 10 fois la validation croisée pour évaluer notre approche.
Les résultats montrent que les performances des SVMs et des CRFs sont très comparables.
Dans l'ensemble, les SVMs ont légèrement dépassé les CRFs au niveau des échantillons (92,58 % contre 92,14 %) et la moyenne de précision des CRFs dépasse celle des SVMs (89,48 % contre 89,29 %).
Ces résultats sont très prometteurs étant donné que nous avons utilisé un corpus de seulement~20k mots.
American Psychological Association (APA)
Outahajala, Muhammad& Benajiba, Yasin& Rosso, Paolo& Zenkouar, Lahbib. 2012. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI،Vol. 2012, no. 6, pp.48-61.
https://search.emarefa.net/detail/BIM-337259
Modern Language Association (MLA)
Outahajala, Muhammad…[et al.]. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI No. 6 (2012), pp.48-61.
https://search.emarefa.net/detail/BIM-337259
American Medical Association (AMA)
Outahajala, Muhammad& Benajiba, Yasin& Rosso, Paolo& Zenkouar, Lahbib. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI. 2012. Vol. 2012, no. 6, pp.48-61.
https://search.emarefa.net/detail/BIM-337259
Data Type
Journal Articles
Language
French
Notes
Includes bibliographical references : p. 60-61
Record ID
BIM-337259