Development and evaluation of two memory architectures for the hardware version of CNN face recognizer

Other Title(s)

تطوير و تقييم نموذجين من معماريات الذاكرة الخاصة بالنموذج المادي لمميز الوجوه المستخدم للشبكات العصبية اللافوفية

Joint Authors

Dawwd, Shefa Abd al-Rahman
Mahmud, Basil Shakir

Source

al-Rafidain Engineering Journal

Issue

Vol. 16, Issue 3 (31 Aug. 2008)22 p.

Publisher

University of Mosul College of Engineering

Publication Date

2008-08-31

Country of Publication

Iraq

No. of Pages

22

Main Subjects

Telecommunications Engineering

Topics

Abstract AR

إن تصميم معمارية الشبكة العصبية اللافوفية المخصصة لمهام تمييز صور الوجوه أخذ هذه مشكلة إلى ظهور مشكلة عدم توائم نقل المعلومات بين المعالج و الذاكرة بعين الاعتبار.

لقد اعتمد التصميم الأساس للمنظومة بكل وحداته على المعيار الذي ينصح باستخدام المعالجة الرقمية المتوازية في طبقات الشبكة الهرمية القريبة من الإدخال و تقليل التوازي تدريجيا بالاقتراب من طبقة الإخراج.

و لغرض تسريع الحسابات فقد تم تصميم وحدة إدخال و تقطيع المعلومات الصورية اللازمة للتنفيذ المتوازي / المتوالي المعتمد على المعيار أعلاه بشكل كفوء و ذلك اعتمادا على مبدأ الخزن الكاشي لمتجهات الإدخال في مخازن FPGA متعددة المرافئ المسماة RAMs و اللازمة لبدء الحسابات في المعالجات المتوازية.

تم تصميم وحدة ادخال و تقطيع المعلومات الصورية بطريقتين، ثم أجريت مقارنة بين الطريقتين نسبة إلى العدد الكلي لمرات الوصول إلى الذاكرة اللازمة لإكمال الحسابات اللازمة لإنتاج شفرة تمييز كل صورة مطبقة على إدخال المنظومة.

تم تقييم عمل منظومة الزمن الحقيقي المادية المنفذة من خلال مقارنة انجازها مع منظومة برمجية مصممة لنفس الغرض و منفذة باستخدام حاسبة شخصية (GHz 204, Pentium 4).

تم الحصول على تسارع بمقدار 88 عند استخدام الطريقة الأولى مقارنة مع تسارع بمقدار 44 تم الحصول عليه باستخدام الطريقة الثانية.

Abstract EN

The design of the proposed Convolutional Neural Network (CNN) architecture for face image recognition takes the constraints on the bandwidth of the communications between memory and processor into the account.

The coarse grained parallelism which performed in the bottom layer node's calculations is reduced in consequent manner until the calculation of one simple node in the upper layer is achieved sequentially.

Two methods of segmentation are used to buffer the image data required for these parallel to sequential calculations from the image RAM to multi-port RAMs.

A comparison between these two methods with respect to the whole number of RAM access required to generate the system recognition code is performed.

A speedup of 44 is achieved when the hardware system is implemented with the using of the 1st method of segmentation as compared to a Pentium 4, 2.4 GHz sequential computer software implementation.

While a speedup of 88 is achieved when the same hardware system is implemented but with the using of the 2nd segmentation method, compared to the same mentioned sequential computer.

American Psychological Association (APA)

Mahmud, Basil Shakir& Dawwd, Shefa Abd al-Rahman. 2008. Development and evaluation of two memory architectures for the hardware version of CNN face recognizer. al-Rafidain Engineering Journal،Vol. 16, no. 3.
https://search.emarefa.net/detail/BIM-338022

Modern Language Association (MLA)

Mahmud, Basil Shakir& Dawwd, Shefa Abd al-Rahman. Development and evaluation of two memory architectures for the hardware version of CNN face recognizer. al-Rafidain Engineering Journal Vol. 16, no. 3 (2008).
https://search.emarefa.net/detail/BIM-338022

American Medical Association (AMA)

Mahmud, Basil Shakir& Dawwd, Shefa Abd al-Rahman. Development and evaluation of two memory architectures for the hardware version of CNN face recognizer. al-Rafidain Engineering Journal. 2008. Vol. 16, no. 3.
https://search.emarefa.net/detail/BIM-338022

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references

Record ID

BIM-338022