Speaker age detection using eigen value

Joint Authors

al-Sayf, Khalil Ibrahim
Abd al-Nabi, Hibah A.

Source

Iraqi Journal of Statistical Science

Issue

Vol. 2011, Issue 20 (31 Aug. 2011), pp.271-290, 20 p.

Publisher

University of Mosul College of Computer Science and Mathematics

Publication Date

2011-08-31

Country of Publication

Iraq

No. of Pages

20

Main Subjects

Mathematics

Abstract AR

في هذا البحث تم اقتراح خوارزمية تعمل على تصنيف عمر المتكلم الى أحد الصنفين : صغار السن و كبار السن بالاعتماد على إشارة كلامه.

تعتمد الخوارزمية المقترحة على استخلاص خواص إشارة الكلام من أجل الحصول على تمثيل ملخص لتلك الإشارة و من ثم الاستفادة من تلك الخواص في عملية التصنيف.

تم في هذه الخوارزمية اعتماد القيم المميزة لمصفوفة التباين التي تم تكوينها من بيانات إشارة الكلام (تكون عادة أحادية البعد) بعد إعادة ترتيبها على هيئة عدد (2, 4, 8, 16, 32, 64) من المصفوفات الثنائية المربعة كعامل أساسي في عملية التمييز بين الصنفين.

تتكون الخوارزمية المقترحة من مرحلتين رئيستين : • المرحلة الأولى : تضمنت إعداد ملف البيانات و الذي ضم القيم المميزة لعدد من الأشخاص (80) من كلا الصنفين صغار و كبار السن (و لكلا الجنسين).

إذ تم في هذه المرحلة ايضا إيجاد المعدل العام لتلك القيم لكل صنف بشكل مستقل و من ثم إيجاد منحني حد العتبة الذي يمثل الحد الفاصل بين الصنفين.

• المرحلة الثانية : و يتم فيها عملية التصنيف من خلال مقارنة المنحني الذي يمثل القيم المميزة لإشارة الكلام مع منحني حد العتبة.

إذ تم اعتماد عدد من المقاييس في عملية تقييم دقة التصنيف.

و إذ تراوحت قيم معامل الارتباط (coefficient correlation) بين (0.9610، 0.9994) عندما m = 2 و m = 64 على التوالي (و هذا يعني أنه كلما زادت عدد المصفوفات المكونة منها إشارة الكلام زاد مقدار الترابط)، مع وجود تباين كبير عند قياس عامل mmse.

فبعد تطبيق الخوارزمية المقترحة على 50 شخص من كلا الجنسين وجد أن الخوارزمية نجحت في تصنيف عمر الأشخاص بنسبة 80 % و أخفقت بنسبة 20 % منهم.

Abstract EN

In this research an algorithm was suggested for classifying a speaker age to two classes : (young and old classes) based on his speech signal.

The suggested algorithm depend on a speech signal feature extraction in order to get a compact representation for this signal and to adopte these features in the classification process.

In this algorithm, the eigen values of the covariance matrix was adopted as a principle parameter in the recognition between the two classes.

It was constructed from the data of the speech signal (usually one dimension) after rearranghng it into a number (2, 4, 8, 16, 32, 64) of a two dimension square matrix array.

The suggested algorithm include two main stages : 1st stage : includes data file preparation that contains the eigen values for a number of persons belong to both classes young and old (with different gender), in this stage the average of these values for each class to be calculated separately and the threshold curve(which represents the boundary seperating between two classes) were also computed.

Second stage : in this stage the classification process was done by comparing the curve that represents the eigen values of the speech signal, with the threshold curve, a different number of performance parameters are adopted in the evaluation the accuracy of the classification process.

The measured correlation value was in range of (0.9610, 0.9994) when m = 2 and m = 64, respectively (this means whenever the number of arrays that the speech signal constructed from it increases, the correlation coefficient also increases), while a clear difference can be seen with mmse parameter.

After applying the suggested algorithm on 50 persons from both genders, the algorithm passed in applying 80 % and failed in percentage 20 % of them.

American Psychological Association (APA)

al-Sayf, Khalil Ibrahim& Abd al-Nabi, Hibah A.. 2011. Speaker age detection using eigen value. Iraqi Journal of Statistical Science،Vol. 2011, no. 20, pp.271-290.
https://search.emarefa.net/detail/BIM-399955

Modern Language Association (MLA)

al-Sayf, Khalil Ibrahim& Abd al-Nabi, Hibah A.. Speaker age detection using eigen value. Iraqi Journal of Statistical Science No. 20 (2011), pp.271-290.
https://search.emarefa.net/detail/BIM-399955

American Medical Association (AMA)

al-Sayf, Khalil Ibrahim& Abd al-Nabi, Hibah A.. Speaker age detection using eigen value. Iraqi Journal of Statistical Science. 2011. Vol. 2011, no. 20, pp.271-290.
https://search.emarefa.net/detail/BIM-399955

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 289-290

Record ID

BIM-399955