مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة

العناوين الأخرى

A comparison between some methods of estimating the sample size to estimate the parameters of the classification model in the case of high-dimensional data using simulations

المؤلفون المشاركون

دجلة إبراهيم مهدي
بلاسم سعدون جاسم

المصدر

مجلة تكريت للعلوم الإدارية و الاقتصادية

العدد

المجلد 16، العدد 50، ج. 2 (30 يونيو/حزيران 2020)، ص ص. 316-328، 13ص.

الناشر

جامعة تكريت كلية الإدارة و الاقتصاد.

تاريخ النشر

2020-06-30

دولة النشر

العراق

عدد الصفحات

13

التخصصات الرئيسية

الاقتصاد و التجارة

الموضوعات

الملخص AR

تم في هذا البحث استعمال عدة طرائق لتحديد حجم العينة الامثل لتقدير معالم البيانات ذات الابعاد العالية ((High dimensional: HDD التي يكون فيها عدد المتغيرات التوضيحية اكبر من حجم العينة.

و هذه الطرائق هي طريقة متباينة بونفروني وهي حالة خاصة من التقريب الطبيعي و طريقة متباينة بيرشتاين.

يتم تقدير انموذج الانحدار اللوجستي الثنائي اللاخطي بحجم عينة كل طريقة في حالة بيانات عالية الابعاد باستعمال طريقة الذكاء الاصطناعي وهي طريقة الشبكة العصبية الاصطناعية (ANN) كونها تعطي تقدير عالي الدقة بما يتناسب مع نوع البيانات ونوع الدراسة الطبية.

يتم توظيف القيم الاحتمالية التي تم الحصول عليها من الشبكة العصبية الاصطناعية في حساب مؤشر اعادة التصنيف الصافي (NRI) تم كتابة برنامج لهذا الغرض باستعماله لغة البرمجة الاحصائية (R) حيث تم الاعتماد على معيار متوسط اكبر خطا مطلق (MME) لمؤشر شبكة اعادة التصنيف الصافي (NRI) للمقارنة بين طرائق تحديد حجم العينة وبوجود عدد المعلمات الافتراضية مختلفة في ظل قيمة هامش خطا معين.

للتحقق من اداء الطرائق باستعمال معايير المقارنة اعلاه حيث كانت اهم الاستنتاجات هي ان طريقة متباينة بيرشتاين هي الافضل في تحديد حجم العينة الامثل باختلاف عدد المعلمات الافتراضية وقيمة هامش الخطأ.

الملخص EN

In this research, several methods were used to determine the optimum sample size to estimate the parameters of high-dimensional data (HDD).

Where the number of explanatory variables is greater than the sample size (P> n).

These methods are the Bonferroni inequality method a special case of normal approximation and the Bernstein's inequality method.

The non-linear logistic regression model is estimated in the sample size of each method in the case of high-dimensional data using the artificial intelligence method, which is the artificial neural network method (ANN), as it gives a high-precision estimate commensurate with the data type and type of medical study.

The probabilistic values obtained from the artificial neural network are used in the calculation of the net reclassification index.

A program was written for this purpose using the statistical programming language (R) where the mean maximum olute error criterion (MME) of the net reclassification network index (NRI) was used to compare the methods of specifying the sample size and the presence of a number of different default parameters under the given margin of error value (ε).

To verify the performance of the methods using the comparison criteria above where the most important conclusions were that the Bernstein's inequality method is the better in determining the optimal sample size according to the number of default parameters and the error margin value.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

بلاسم سعدون جاسم ودجلة إبراهيم مهدي. 2020. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية،مج. 16، ع. 50، ج. 2، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

بلاسم سعدون جاسم ودجلة إبراهيم مهدي. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية مج. 16، ع. 50، ج. 2 (2020)، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

بلاسم سعدون جاسم ودجلة إبراهيم مهدي. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية. 2020. مج. 16، ع. 50، ج. 2، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269

نوع البيانات

مقالات

لغة النص

العربية

الملاحظات

-

رقم السجل

BIM-1033269