Chinese Unknown Word Recognition for PCFG-LA Parsing
المؤلفون المشاركون
Wong, Derek F.
Chao, Lidia S.
Huang, Qiuping
He, Liangye
المصدر
العدد
المجلد 2014، العدد 2014 (31 ديسمبر/كانون الأول 2014)، ص ص. 1-7، 7ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2014-04-09
دولة النشر
مصر
عدد الصفحات
7
التخصصات الرئيسية
الطب البشري
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
This paper investigates the recognition of unknown words in Chinese parsing.
Two methods are proposed to handle this problem.
One is the modification of a character-based model.
We model the emission probability of an unknown word using the first and last characters in the word.
It aims to reduce the POS tag ambiguities of unknown words to improve the parsing performance.
In addition, a novel method, using graph-based semisupervised learning (SSL), is proposed to improve the syntax parsing of unknown words.
Its goal is to discover additional lexical knowledge from a large amount of unlabeled data to help the syntax parsing.
The method is mainly to propagate lexical emission probabilities to unknown words by building the similarity graphs over the words of labeled and unlabeled data.
The derived distributions are incorporated into the parsing process.
The proposed methods are effective in dealing with the unknown words to improve the parsing.
Empirical results for Penn Chinese Treebank and TCT Treebank revealed its effectiveness.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Huang, Qiuping& He, Liangye& Wong, Derek F.& Chao, Lidia S.. 2014. Chinese Unknown Word Recognition for PCFG-LA Parsing. The Scientific World Journal،Vol. 2014, no. 2014, pp.1-7.
https://search.emarefa.net/detail/BIM-1051753
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Huang, Qiuping…[et al.]. Chinese Unknown Word Recognition for PCFG-LA Parsing. The Scientific World Journal No. 2014 (2014), pp.1-7.
https://search.emarefa.net/detail/BIM-1051753
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Huang, Qiuping& He, Liangye& Wong, Derek F.& Chao, Lidia S.. Chinese Unknown Word Recognition for PCFG-LA Parsing. The Scientific World Journal. 2014. Vol. 2014, no. 2014, pp.1-7.
https://search.emarefa.net/detail/BIM-1051753
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1051753
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر