مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة

Other Title(s)

A comparison between some methods of estimating the sample size to estimate the parameters of the classification model in the case of high-dimensional data using simulations

Joint Authors

دجلة إبراهيم مهدي
بلاسم سعدون جاسم

Source

مجلة تكريت للعلوم الإدارية و الاقتصادية

Issue

Vol. 16, Issue 50، ج. 2 (30 Jun. 2020), pp.316-328, 13 p.

Publisher

Tikrit University College of Administration and Economic

Publication Date

2020-06-30

Country of Publication

Iraq

No. of Pages

13

Main Subjects

Economy and Commerce

Topics

Abstract AR

تم في هذا البحث استعمال عدة طرائق لتحديد حجم العينة الامثل لتقدير معالم البيانات ذات الابعاد العالية ((High dimensional: HDD التي يكون فيها عدد المتغيرات التوضيحية اكبر من حجم العينة.

و هذه الطرائق هي طريقة متباينة بونفروني وهي حالة خاصة من التقريب الطبيعي و طريقة متباينة بيرشتاين.

يتم تقدير انموذج الانحدار اللوجستي الثنائي اللاخطي بحجم عينة كل طريقة في حالة بيانات عالية الابعاد باستعمال طريقة الذكاء الاصطناعي وهي طريقة الشبكة العصبية الاصطناعية (ANN) كونها تعطي تقدير عالي الدقة بما يتناسب مع نوع البيانات ونوع الدراسة الطبية.

يتم توظيف القيم الاحتمالية التي تم الحصول عليها من الشبكة العصبية الاصطناعية في حساب مؤشر اعادة التصنيف الصافي (NRI) تم كتابة برنامج لهذا الغرض باستعماله لغة البرمجة الاحصائية (R) حيث تم الاعتماد على معيار متوسط اكبر خطا مطلق (MME) لمؤشر شبكة اعادة التصنيف الصافي (NRI) للمقارنة بين طرائق تحديد حجم العينة وبوجود عدد المعلمات الافتراضية مختلفة في ظل قيمة هامش خطا معين.

للتحقق من اداء الطرائق باستعمال معايير المقارنة اعلاه حيث كانت اهم الاستنتاجات هي ان طريقة متباينة بيرشتاين هي الافضل في تحديد حجم العينة الامثل باختلاف عدد المعلمات الافتراضية وقيمة هامش الخطأ.

Abstract EN

In this research, several methods were used to determine the optimum sample size to estimate the parameters of high-dimensional data (HDD).

Where the number of explanatory variables is greater than the sample size (P> n).

These methods are the Bonferroni inequality method a special case of normal approximation and the Bernstein's inequality method.

The non-linear logistic regression model is estimated in the sample size of each method in the case of high-dimensional data using the artificial intelligence method, which is the artificial neural network method (ANN), as it gives a high-precision estimate commensurate with the data type and type of medical study.

The probabilistic values obtained from the artificial neural network are used in the calculation of the net reclassification index.

A program was written for this purpose using the statistical programming language (R) where the mean maximum olute error criterion (MME) of the net reclassification network index (NRI) was used to compare the methods of specifying the sample size and the presence of a number of different default parameters under the given margin of error value (ε).

To verify the performance of the methods using the comparison criteria above where the most important conclusions were that the Bernstein's inequality method is the better in determining the optimal sample size according to the number of default parameters and the error margin value.

American Psychological Association (APA)

بلاسم سعدون جاسم ودجلة إبراهيم مهدي. 2020. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية،مج. 16، ع. 50، ج. 2، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269

Modern Language Association (MLA)

بلاسم سعدون جاسم ودجلة إبراهيم مهدي. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية مج. 16، ع. 50، ج. 2 (2020)، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269

American Medical Association (AMA)

بلاسم سعدون جاسم ودجلة إبراهيم مهدي. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية. 2020. مج. 16، ع. 50، ج. 2، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269

Data Type

Journal Articles

Language

Arabic

Notes

-

Record ID

BIM-1033269