U-Net cost analysis using roofline model

Other Title(s)

تحليل كلفة U-Net باستخدام نموذج Roofline

Joint Authors

Ali, Fakhr al-Din Hamid
Dawwd, Shefa Abd al-Rahman
Salim, Ula Tariq

Source

al-Rafidain Engineering Journal

Issue

Vol. 27, Issue 2 (30 Sep. 2022), pp.198-205, 8 p.

Publisher

University of Mosul College of Engineering

Publication Date

2022-09-30

Country of Publication

Iraq

No. of Pages

8

Main Subjects

Information Technology and Computer Science

Topics

Abstract AR

من أهم التحديات التي تواجه أداء هندسة U-Net هي طريقة تصميم مكوناتها وكيفية اختيار جهاز الحوسبة المناسب للتعامل مع مجموعات البيانات التدريبية المسمى.

الالتفاف هو أكثر العمليات التي تتطلب الحسابات وتكاليف الذاكرة، والتي يجب تقليلها.

وبالتالي، فإن أحد الاختيارات المناسبة هو تغيير نوع الالتواء.

تتمثل الحلول الأخرى المقترحة في تقليل حجم الصورة وعدد البتات وقيمة الخطوة بالإضافة إلى عدد المرشحات ودفعات الصور.

لذلك، في هذا البحث، سيتم استخدام نموذج Roofline كدليل أداء في تحليل FLOPs وحدود عرض النطاق الترددي للذاكرة لنموذج U-Net بتكوينات مختلفة.

تم تقييم التكلفة بالمقارنة مع محدودية ثلاثة أجهزة حوسبة، GPU230MX وGPU940MX وGPU2060rtx super.

تم استخدام مجموعة بيانات صورة 128 × 128 أثناء عملية تقييم أداء التكلفة في U-Net.

بناء على التحليل، تظهر نتائج التقييم أن الحل الذي يحقق التوازن بين الذاكرة والحسابات هو تنفيذ نموذج U-Net بالتوازي باستخدام بطاقة سوبر RTX2060 مع تكوينات حجم الدفعة 16، حجم الصورة 128 × 128، عدد البتات هو 32، إدارة الذاكرة المشتركة.

Abstract EN

One of the most important challenges facing u-net architecture performance is the method design of its components and how to choose the suitable hardware computing device to deal with the training labelled datasets.

convolution is the most process that requires computations and memory costs, which is needs to minimize.

thus, one of the suitable selection is to change the type of the convolution.

other suggested solutions are to reduce the size of image, number of bits, and, stride value, in addition to number of filters, and image batches.

therefore, in this paper the roofline model will used as performance guide in analyzing the flops and the memory bandwidth boundaries of a u-net model with different configurations.

the cost has been assessed with compared to the limitation of three computing devices, GPU230MX, GPU940MX and GPU2060RTX super.

128 × 128 image dataset has been used during the u-net cost-performance evaluation process.

based on the analysis, the evaluation results show that the solution that achieves a balance between memory and computations is to implement a u-net model in parallel using RTX2060 super card with the configurations of batch size is 16, image size of 128 × 128, number of bits is 32, shared memory management.

American Psychological Association (APA)

Salim, Ula Tariq& Dawwd, Shefa Abd al-Rahman& Ali, Fakhr al-Din Hamid. 2022. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal،Vol. 27, no. 2, pp.198-205.
https://search.emarefa.net/detail/BIM-1560155

Modern Language Association (MLA)

Salim, Ula Tariq…[et al.]. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal Vol. 27, no. 2 (Sep. 2022), pp.198-205.
https://search.emarefa.net/detail/BIM-1560155

American Medical Association (AMA)

Salim, Ula Tariq& Dawwd, Shefa Abd al-Rahman& Ali, Fakhr al-Din Hamid. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal. 2022. Vol. 27, no. 2, pp.198-205.
https://search.emarefa.net/detail/BIM-1560155

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references: p. 204-205

Record ID

BIM-1560155