Evaluation of soft segment modeling on acontext independent phoneme classification system

Joint Authors

Razzazi, Farbod
Sayadiyan, Abu al-Qasim

Source

The Arabian Journal for Science and Engineering. Section B, Engineering

Issue

Vol. 32, Issue 1B (30 Apr. 2007), pp.49-65, 17 p.

Publisher

King Fahd University of Petroleum and Minerals

Publication Date

2007-04-30

Country of Publication

Saudi Arabia

No. of Pages

17

Main Subjects

Electronic engineering

Abstract AR

يعتبر التوزيع الهندسي لامتداد الحالة من الافتراضات الأساسية التي تحد من أداء نمذجة ماركوف للإشارة الصوتية.

و على العموم، فإن أنموذج الأجزاء التتابعية - العشوائية، و كذلك جزئياتHMM ، و على الخصوص، لتجاوز هذا النقص جزئيا يؤدي بدوره إلى زيادة في درجة صعوبة في تدريب و تحديد الطور.

إضافة إلى هذا الافتراض، لم ندرج التغير الزمني التدريجي للإحصائيات الصوت ضمن نموذج.

HMM نعرض في هذا البحث طريقة جديدة للنمذجة، حيث نورد في النموذج أثر الجزئيات المتجاورة على تقدير احتمالات اقتران الكثافة و كذلك حساب كل جزئية صوتية، بذلك يكون الأنموذج أكثر ثباتا ضد الأخطاء الجزئية، و كذلك يعالج التغير من جزئية إلى أخرى باستخدام أقل عدد من الباراميترات.

تم اختبار هذا الانموذج باستخدام نظام TIMIT الذي يعتمد على نظام الجزئيات الصوتية المستقلة.

أثناء الاختبار تم تصنيف الجزئيات الصوتية باستخدام عدة طرق للتعرف عليها و التوصل إلى أفضل الحلول و من ثم مقارنتها بأنموذج كثافي متصل-أنموذج ماركوف المستتر .

.(CDHMM) أظهرت النتائج تحسنا بقدر % 8 – 10 في التعرف الصوتي مقارنة بأنموذج ماركوف الأساسي.

Abstract EN

The geometric distribution of states' duration is one of the main performance limiting assumptions of hidden Markov modeling of speech signals.

Stochastic segment models, generally, and segmental HMM, specifically, overcome this deficiency partly at the cost of more complexity in both training and recognition phases.

In addition to this assumption, the gradual temporal changes of speech statistics has not been modeled in HMM.

In this paper, a new duration modeling approach is presented.

The main idea of the model is to consider the effect of adjacent segments on the probability density function estimation and evaluation of each acoustic segment.

This idea not only makes the model robust against segmentation errors, but also it models gradual change from one segment to the next one with a minimum set of parameters.

The proposed idea is analytically formulated and tested on a TIMIT based context independent phoneme classification system.

During the test procedure, the phoneme classification of different phoneme classes was performed by applying various proposed recognition algorithms.

The system was optimized and the results have been compared with a continuous density hidden Markov model (CDHMM) with similar computational complexity.

The results show 8–10% improvement in phoneme recognition rate in comparison with standard continuous density hidden Markov model.

This indicates improved compatibility of the proposed model with the speech nature.

American Psychological Association (APA)

Razzazi, Farbod& Sayadiyan, Abu al-Qasim. 2007. Evaluation of soft segment modeling on acontext independent phoneme classification system. The Arabian Journal for Science and Engineering. Section B, Engineering،Vol. 32, no. 1B, pp.49-65.
https://search.emarefa.net/detail/BIM-358991

Modern Language Association (MLA)

Razzazi, Farbod& Sayadiyan, Abu al-Qasim. Evaluation of soft segment modeling on acontext independent phoneme classification system. The Arabian Journal for Science and Engineering. Section B, Engineering Vol. 32, no. 1B (Apr. 2007), pp.49-65.
https://search.emarefa.net/detail/BIM-358991

American Medical Association (AMA)

Razzazi, Farbod& Sayadiyan, Abu al-Qasim. Evaluation of soft segment modeling on acontext independent phoneme classification system. The Arabian Journal for Science and Engineering. Section B, Engineering. 2007. Vol. 32, no. 1B, pp.49-65.
https://search.emarefa.net/detail/BIM-358991

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 64-56

Record ID

BIM-358991