U-Net cost analysis using roofline model
Other Title(s)
تحليل كلفة U-Net باستخدام نموذج Roofline
Joint Authors
Ali, Fakhr al-Din Hamid
Dawwd, Shefa Abd al-Rahman
Salim, Ula Tariq
Source
al-Rafidain Engineering Journal
Issue
Vol. 27, Issue 2 (30 Sep. 2022), pp.198-205, 8 p.
Publisher
University of Mosul College of Engineering
Publication Date
2022-09-30
Country of Publication
Iraq
No. of Pages
8
Main Subjects
Information Technology and Computer Science
Topics
Abstract AR
من أهم التحديات التي تواجه أداء هندسة U-Net هي طريقة تصميم مكوناتها وكيفية اختيار جهاز الحوسبة المناسب للتعامل مع مجموعات البيانات التدريبية المسمى.
الالتفاف هو أكثر العمليات التي تتطلب الحسابات وتكاليف الذاكرة، والتي يجب تقليلها.
وبالتالي، فإن أحد الاختيارات المناسبة هو تغيير نوع الالتواء.
تتمثل الحلول الأخرى المقترحة في تقليل حجم الصورة وعدد البتات وقيمة الخطوة بالإضافة إلى عدد المرشحات ودفعات الصور.
لذلك، في هذا البحث، سيتم استخدام نموذج Roofline كدليل أداء في تحليل FLOPs وحدود عرض النطاق الترددي للذاكرة لنموذج U-Net بتكوينات مختلفة.
تم تقييم التكلفة بالمقارنة مع محدودية ثلاثة أجهزة حوسبة، GPU230MX وGPU940MX وGPU2060rtx super.
تم استخدام مجموعة بيانات صورة 128 × 128 أثناء عملية تقييم أداء التكلفة في U-Net.
بناء على التحليل، تظهر نتائج التقييم أن الحل الذي يحقق التوازن بين الذاكرة والحسابات هو تنفيذ نموذج U-Net بالتوازي باستخدام بطاقة سوبر RTX2060 مع تكوينات حجم الدفعة 16، حجم الصورة 128 × 128، عدد البتات هو 32، إدارة الذاكرة المشتركة.
Abstract EN
One of the most important challenges facing u-net architecture performance is the method design of its components and how to choose the suitable hardware computing device to deal with the training labelled datasets.
convolution is the most process that requires computations and memory costs, which is needs to minimize.
thus, one of the suitable selection is to change the type of the convolution.
other suggested solutions are to reduce the size of image, number of bits, and, stride value, in addition to number of filters, and image batches.
therefore, in this paper the roofline model will used as performance guide in analyzing the flops and the memory bandwidth boundaries of a u-net model with different configurations.
the cost has been assessed with compared to the limitation of three computing devices, GPU230MX, GPU940MX and GPU2060RTX super.
128 × 128 image dataset has been used during the u-net cost-performance evaluation process.
based on the analysis, the evaluation results show that the solution that achieves a balance between memory and computations is to implement a u-net model in parallel using RTX2060 super card with the configurations of batch size is 16, image size of 128 × 128, number of bits is 32, shared memory management.
American Psychological Association (APA)
Salim, Ula Tariq& Dawwd, Shefa Abd al-Rahman& Ali, Fakhr al-Din Hamid. 2022. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal،Vol. 27, no. 2, pp.198-205.
https://search.emarefa.net/detail/BIM-1560155
Modern Language Association (MLA)
Salim, Ula Tariq…[et al.]. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal Vol. 27, no. 2 (Sep. 2022), pp.198-205.
https://search.emarefa.net/detail/BIM-1560155
American Medical Association (AMA)
Salim, Ula Tariq& Dawwd, Shefa Abd al-Rahman& Ali, Fakhr al-Din Hamid. U-Net cost analysis using roofline model. al-Rafidain Engineering Journal. 2022. Vol. 27, no. 2, pp.198-205.
https://search.emarefa.net/detail/BIM-1560155
Data Type
Journal Articles
Language
English
Notes
Includes bibliographical references: p. 204-205
Record ID
BIM-1560155