Distributed tree code on cluster of workstations

العناوين الأخرى

تنفيذ الشيفرة الشجرية التوزيعية على مجموعة محطات عمل

المؤلف

Makki, Muhammad A.

المصدر

IUG Journal of Natural Studies

العدد

المجلد 10، العدد 1 (31 يناير/كانون الثاني 2002)، ص ص. 43-73، 31ص.

الناشر

الجامعة الإسلامية-غزة عمادة شؤون البحث العلمي و الدراسات العليا

تاريخ النشر

2002-01-31

دولة النشر

فلسطين (قطاع غزة)

عدد الصفحات

31

التخصصات الرئيسية

تكنولوجيا المعلومات وعلم الحاسوب

الموضوعات

الملخص AR

في هذا البحث نقوم بتصميم أربع طرق لتحسين أداء الاصدارة التوزيعية لخوارزمية BH.

هذه الطرق يتم تنفيذها على مجموعة من محطات العمل و تقوم باستخدام نموذج الاتصال عبر تمرير الرسائل.

الطريقة الأولى تقوم بتجزئة البيانات و موازنة الحمل على المعالجات بحيت تصبح الخوارزمية توزيعية بشكل كامل و بدون حمل زائد أولي.

الطريقة لثانية تستخدم التقنية الأنبيوبية و تجزئة مجالات المعالجات لتحسين التداخل بين حسابات القوة و اتصالات المعالجات.

هذه الطريقة تقوم أيضا بجعل اتصالات المعالجات غير متزامنة لتقليل زمن انتظار المعالجات.

الطريقة الثالثة تقوم بتغيير نموذج اتصال المعالجات من الند للند إلى خادم العميل.

هذا التغيير يقلل من الحمل الزائد الكلي للاتصال بين المعالجات.

الطريقة الرابعة تقوم بالتجوال مرة واحدة في شجرة الأجيام لحساب القوة المؤثرة على جميع الأجسام التابعة لمجال معالج واحد بدلا من التجوال مرة لكل جسم.

هذه الطريقة تقلل من زمن تنفيذ البرنامج بشكل كبير.

لقد تم استخدام لغة C++ لكتابة شيفرة البرامج التي تم بواسطتها تصميم الطرق الأربعة، كما تم أيضا استخدام دوال مكتبة البرامج MPI (الاتصال بواسطة تمرير الرسائل).

إن دوال مكتبة MPI مدعومة من قبل جميع الحاسبات المتوازية و التوزيعية.

لقد قمنا بتصميم تجارب محاكاة لقياس فاعلية التقنيات الأربعة المقترحة.

و باستخدام هذه التجارب قمنا بقياس مختلف معايير الفاعلية مثل السرعة، فعالية النظام، الزمن التنفيذي الكلي، و الحمل الزائد للاتصال.

إن التقنيات المقترحة تقوم بتحسين الكفاءة من 10-45% مقارنة بخوارزمية الشيفرة الشجرية التوزيعية التي لا تستخدم تلك التقنيات.

إن البرامج التي قمنا بتصميمها مرنة و فعالة بدرجة أكبر بكثير من الخوارزميات الحالية المستخدمة لحل مشكلة الأجسام ذات العدد س.

رغم أن الخوارزميات المقترحة ليست فريدة إلا إنها متينة، قابلة للتوسع، موازنة للحمل، و متحملة للأخطاء.

إنها تقوم بتدعيم و استكمال الأعمال السابقة في هذا المجال.

الملخص EN

Abstract In this paper, we design four performance BH algorithm optimization techniques to the distributed versions of the run on clusters of workstations and use message passing communication model.

The first technique partitions the data and balances the load among the processors so that the algorithm becomes fully distributed with no initialization overhead.

The second method uses pipelining and processor domain partitioning to enhance the overlapping between force computation and processor communication.

It also makes communication asynchronous to minimize processor waiting time.

The third method changes the processor communication model from pert- peer to master-slave.

This change minimizes the total communication overhead.

The fourth method uses one tree traversal for computing the force on all particles in the processor domain instead of traversing the tree once for each particle.

This method reduces the run time very significantly.

Our code is written in C++ and uses MPI (Message (Passing Interface functions.

MPI functions are supported on almost all parallel machines so the code is portable to different platforms.

We use simulation experiments to measure the efficiency of our performance optimization techniques.

From these experiments we measure various performance metrics such as speedup, system efficiency, total execution time, and communication overhead.

The proposed optimization techniques achieve 10-45% of performance optimization compared to the non-optimized distributed BH algorithms.

Our code is far more flexible and efficient than the current existing code used to solve the n-body problem.

Although our algorithm is not unique, it is a robust, scalable, load balancing and fault–tolerant algorithm.

It complements, enhances and extends the previous work done in this field.

نمط استشهاد جمعية علماء النفس الأمريكية (APA)

Makki, Muhammad A.. 2002. Distributed tree code on cluster of workstations. IUG Journal of Natural Studies،Vol. 10, no. 1, pp.43-73.
https://search.emarefa.net/detail/BIM-101503

نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)

Makki, Muhammad A.. Distributed tree code on cluster of workstations. IUG Journal of Natural Studies Vol. 10, no. 1 (Dec. 2002), pp.43-73.
https://search.emarefa.net/detail/BIM-101503

نمط استشهاد الجمعية الطبية الأمريكية (AMA)

Makki, Muhammad A.. Distributed tree code on cluster of workstations. IUG Journal of Natural Studies. 2002. Vol. 10, no. 1, pp.43-73.
https://search.emarefa.net/detail/BIM-101503

نوع البيانات

مقالات

لغة النص

الإنجليزية

الملاحظات

Includes bibliographical references : p. 72-73

رقم السجل

BIM-101503