U-Net cost analysis using roofline model

العناوين الأخرى

تحليل كلفة U-Net باستخدام نموذج Roofline

المؤلفون المشاركون

Ali, Fakhr al-Din Hamid
Dawwd, Shefa Abd al-Rahman
Salim, Ula Tariq

المصدر

al-Rafidain Engineering Journal

العدد

المجلد 27، العدد 2 (30 سبتمبر/أيلول 2022)، ص ص. 198-205، 8ص.

الناشر

جامعة الموصل كلية الهندسة

تاريخ النشر

2022-09-30

دولة النشر

العراق

عدد الصفحات

8

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

من أهم التحديات التي تواجه أداء هندسة U-Net هي طريقة تصميم مكوناتها وكيفية اختيار جهاز الحوسبة المناسب للتعامل مع مجموعات البيانات التدريبية المسمى.

الالتفاف هو أكثر العمليات التي تتطلب الحسابات وتكاليف الذاكرة، والتي يجب تقليلها.

وبالتالي، فإن أحد الاختيارات المناسبة هو تغيير نوع الالتواء.

تتمثل الحلول الأخرى المقترحة في تقليل حجم الصورة وعدد البتات وقيمة الخطوة بالإضافة إلى عدد المرشحات ودفعات الصور.

لذلك، في هذا البحث، سيتم استخدام نموذج Roofline كدليل أداء في تحليل FLOPs وحدود عرض النطاق الترددي للذاكرة لنموذج U-Net بتكوينات مختلفة.

تم تقييم التكلفة بالمقارنة مع محدودية ثلاثة أجهزة حوسبة، GPU230MX وGPU940MX وGPU2060rtx super.

تم استخدام مجموعة بيانات صورة 128 × 128 أثناء عملية تقييم أداء التكلفة في U-Net.

بناء على التحليل، تظهر نتائج التقييم أن الحل الذي يحقق التوازن بين الذاكرة والحسابات هو تنفيذ نموذج U-Net بالتوازي باستخدام بطاقة سوبر RTX2060 مع تكوينات حجم الدفعة 16، حجم الصورة 128 × 128، عدد البتات هو 32، إدارة الذاكرة المشتركة.

الملخص EN

One of the most important challenges facing u-net architecture performance is the method design of its components and how to choose the suitable hardware computing device to deal with the training labelled datasets.

convolution is the most process that requires computations and memory costs, which is needs to minimize.

thus, one of the suitable selection is to change the type of the convolution.

other suggested solutions are to reduce the size of image, number of bits, and, stride value, in addition to number of filters, and image batches.

therefore, in this paper the roofline model will used as performance guide in analyzing the flops and the memory bandwidth boundaries of a u-net model with different configurations.

the cost has been assessed with compared to the limitation of three computing devices, GPU230MX, GPU940MX and GPU2060RTX super.

128 × 128 image dataset has been used during the u-net cost-performance evaluation process.

based on the analysis, the evaluation results show that the solution that achieves a balance between memory and computations is to implement a u-net model in parallel using RTX2060 super card with the configurations of batch size is 16, image size of 128 × 128, number of bits is 32, shared memory management.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Salim, Ula Tariq& Dawwd, Shefa Abd al-Rahman& Ali, Fakhr al-Din Hamid. 2022. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal،Vol. 27, no. 2, pp.198-205.
https://search.emarefa.net/detail/BIM-1560155

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Salim, Ula Tariq…[et al.]. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal Vol. 27, no. 2 (Sep. 2022), pp.198-205.
https://search.emarefa.net/detail/BIM-1560155

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Salim, Ula Tariq& Dawwd, Shefa Abd al-Rahman& Ali, Fakhr al-Din Hamid. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal. 2022. Vol. 27, no. 2, pp.198-205.
https://search.emarefa.net/detail/BIM-1560155

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references: p. 204-205

رقم السجل

BIM-1560155