مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة
Other Title(s)
A comparison between some methods of estimating the sample size to estimate the parameters of the classification model in the case of high-dimensional data using simulations
Joint Authors
دجلة إبراهيم مهدي
بلاسم سعدون جاسم
Source
مجلة تكريت للعلوم الإدارية و الاقتصادية
Issue
Vol. 16, Issue 50، ج. 2 (30 Jun. 2020), pp.316-328, 13 p.
Publisher
Tikrit University College of Administration and Economic
Publication Date
2020-06-30
Country of Publication
Iraq
No. of Pages
13
Main Subjects
Topics
Abstract AR
تم في هذا البحث استعمال عدة طرائق لتحديد حجم العينة الامثل لتقدير معالم البيانات ذات الابعاد العالية ((High dimensional: HDD التي يكون فيها عدد المتغيرات التوضيحية اكبر من حجم العينة.
و هذه الطرائق هي طريقة متباينة بونفروني وهي حالة خاصة من التقريب الطبيعي و طريقة متباينة بيرشتاين.
يتم تقدير انموذج الانحدار اللوجستي الثنائي اللاخطي بحجم عينة كل طريقة في حالة بيانات عالية الابعاد باستعمال طريقة الذكاء الاصطناعي وهي طريقة الشبكة العصبية الاصطناعية (ANN) كونها تعطي تقدير عالي الدقة بما يتناسب مع نوع البيانات ونوع الدراسة الطبية.
يتم توظيف القيم الاحتمالية التي تم الحصول عليها من الشبكة العصبية الاصطناعية في حساب مؤشر اعادة التصنيف الصافي (NRI) تم كتابة برنامج لهذا الغرض باستعماله لغة البرمجة الاحصائية (R) حيث تم الاعتماد على معيار متوسط اكبر خطا مطلق (MME) لمؤشر شبكة اعادة التصنيف الصافي (NRI) للمقارنة بين طرائق تحديد حجم العينة وبوجود عدد المعلمات الافتراضية مختلفة في ظل قيمة هامش خطا معين.
للتحقق من اداء الطرائق باستعمال معايير المقارنة اعلاه حيث كانت اهم الاستنتاجات هي ان طريقة متباينة بيرشتاين هي الافضل في تحديد حجم العينة الامثل باختلاف عدد المعلمات الافتراضية وقيمة هامش الخطأ.
Abstract EN
In this research, several methods were used to determine the optimum sample size to estimate the parameters of high-dimensional data (HDD).
Where the number of explanatory variables is greater than the sample size (P> n).
These methods are the Bonferroni inequality method a special case of normal approximation and the Bernstein's inequality method.
The non-linear logistic regression model is estimated in the sample size of each method in the case of high-dimensional data using the artificial intelligence method, which is the artificial neural network method (ANN), as it gives a high-precision estimate commensurate with the data type and type of medical study.
The probabilistic values obtained from the artificial neural network are used in the calculation of the net reclassification index.
A program was written for this purpose using the statistical programming language (R) where the mean maximum olute error criterion (MME) of the net reclassification network index (NRI) was used to compare the methods of specifying the sample size and the presence of a number of different default parameters under the given margin of error value (ε).
To verify the performance of the methods using the comparison criteria above where the most important conclusions were that the Bernstein's inequality method is the better in determining the optimal sample size according to the number of default parameters and the error margin value.
American Psychological Association (APA)
بلاسم سعدون جاسم ودجلة إبراهيم مهدي. 2020. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية،مج. 16، ع. 50، ج. 2، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269
Modern Language Association (MLA)
بلاسم سعدون جاسم ودجلة إبراهيم مهدي. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية مج. 16، ع. 50، ج. 2 (2020)، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269
American Medical Association (AMA)
بلاسم سعدون جاسم ودجلة إبراهيم مهدي. مقارنة بين بعض طرائق تقدير حجم العينة لتقدير معلمات أنموذج التصنيف في حالة وجود بيانات عالية الابعاد باستعمال المحاكاة. مجلة تكريت للعلوم الإدارية و الاقتصادية. 2020. مج. 16، ع. 50، ج. 2، ص ص. 316-328.
https://search.emarefa.net/detail/BIM-1033269
Data Type
Journal Articles
Language
Arabic
Notes
-
Record ID
BIM-1033269