L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation

المؤلفون المشاركون

Rosso, Paolo
Outahajala, Muhammad
Benajiba, Yasin
Zenkouar, Lahbib

المصدر

e-TI

العدد

المجلد 2012، العدد 6 (31 ديسمبر/كانون الأول 2012)، ص ص. 48-61، 14ص.

الناشر

جامعة محمد الخامس أكدال المدرسة المحمدية للمهندسين

تاريخ النشر

2012-12-31

دولة النشر

المغرب

عدد الصفحات

14

التخصصات الرئيسية

اللغات والآداب المقارنة

الموضوعات

الملخص FRE

L’objectif de cet article est de présenter le premier étiqueteur grammatical amazighe.

Très peu de ressources ont été développées pour l’amazighe et nous croyons que le développement d’un outil d’étiquetage grammatical est une étape préalable au traitement automatique de textes.

Afin d'atteindre cet objectif, nous avons formé deux modèles de classification de séquences en utilisant les SVMs, séparateurs à vaste marge (Support Vector Machines) et les CRFs, champs markoviens conditionnels (Conditional Random Fields) en utilisant une phase de segmentation.

Nous avons utilisé la technique de 10 fois la validation croisée pour évaluer notre approche.

Les résultats montrent que les performances des SVMs et des CRFs sont très comparables.

Dans l'ensemble, les SVMs ont légèrement dépassé les CRFs au niveau des échantillons (92,58 % contre 92,14 %) et la moyenne de précision des CRFs dépasse celle des SVMs (89,48 % contre 89,29 %).

Ces résultats sont très prometteurs étant donné que nous avons utilisé un corpus de seulement~20k mots.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Outahajala, Muhammad& Benajiba, Yasin& Rosso, Paolo& Zenkouar, Lahbib. 2012. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI،Vol. 2012, no. 6, pp.48-61.
https://search.emarefa.net/detail/BIM-337259

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Outahajala, Muhammad…[et al.]. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI No. 6 (2012), pp.48-61.
https://search.emarefa.net/detail/BIM-337259

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Outahajala, Muhammad& Benajiba, Yasin& Rosso, Paolo& Zenkouar, Lahbib. L’étiquetage grammatical de l’amazighe en utilisant les propriétés n-grammes et un prétraitement de segmentation. e-TI. 2012. Vol. 2012, no. 6, pp.48-61.
https://search.emarefa.net/detail/BIM-337259

نوع البيانات

مقالات

لغة النص

الفرنسية

الملاحظات

Includes bibliographical references : p. 60-61

رقم السجل

BIM-337259