![](/images/graphics-bg.png)
Comparison of fast regression algorithms in large datasets
المؤلفون المشاركون
Cangur, Sengul
Ankarali, Handan
المصدر
العدد
المجلد 50، العدد 2 A (30 إبريل/نيسان 2023)، ص ص. 1-17، 17ص.
الناشر
جامعة الكويت مجلس النشر العلمي
تاريخ النشر
2023-04-30
دولة النشر
الكويت
عدد الصفحات
17
التخصصات الرئيسية
العلوم الطبية والصيدلة والعلوم الصحية
الملخص EN
The aim is to compare the performances of fast regression methods, namely dimensional reduction of correlation matrix (DRCM), nonparametric dimensional reduction of correlation matrix (N-DRCM), variance inflation factor (VIF) regression, and robust VIF (R-VIF) regression in the presence of multicollinearity and outliers problems.
In all simulation-scenarios, all the target variables were chosen for final models using four methods.
The DRCM and N-DRCM are the methods that reach the final model in the shortest time, respectively.
The time to reach the final model using R-VIF regression was approximately twice shorter than that of VIF regression.
In each method, as the number of variables and the level of outliers increased, the time taken to reach the final model increased.
When the level of multicollinearity and the number of variables (p > 500) increased, the times to reach the final models using DRCM in datasets with outliers were slightly shorter than the those of N-DRCM.
The largest numbers of noise variables were selected to the model using DRCM and N-DRCM, but the least number of them were selected to the model using the R-VIF regression.
The RMSE values obtained using DRCM, N-DRCM and VIF regression were similar in each scenario.
As a result of the real dataset, the final model selected using R-VIF regression had the highest R 2 .
It also had the lowest RMSE value among those obtained with other approaches excluding VIF regression.
As such, the R-VIF regression method demonstrated a better performance than the others in all datasets.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Cangur, Sengul& Ankarali, Handan. 2023. Comparison of fast regression algorithms in large datasets. Kuwait Journal of Science،Vol. 50, no. 2 A, pp.1-17.
https://search.emarefa.net/detail/BIM-1501119
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Cangur, Sengul& Ankarali, Handan. Comparison of fast regression algorithms in large datasets. Kuwait Journal of Science Vol. 50, no. 2 A (Apr. 2023), pp.1-17.
https://search.emarefa.net/detail/BIM-1501119
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Cangur, Sengul& Ankarali, Handan. Comparison of fast regression algorithms in large datasets. Kuwait Journal of Science. 2023. Vol. 50, no. 2 A, pp.1-17.
https://search.emarefa.net/detail/BIM-1501119
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references : p. 16-17
رقم السجل
BIM-1501119
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
![](/images/ebook-kashef.png)
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر
![](/images/kashef-image.png)