Big data : how the open-source software will open the doors for innovation in libraries

Other Title(s)

البيانات الضخمة : البرامج مفتوحة المصدر فتحت الأبواب للابتكار في المكتبات

Author

Salman, Zaynab Abd al-Wahid

Source

al-Mustansiriya Journal of Arts

Issue

Vol. 46, Issue 100 (31 Dec. 2022), pp.23-43, 21 p.

Publisher

Al-Mustansiriyah University College Of Arts

Publication Date

2022-12-31

Country of Publication

Iraq

No. of Pages

21

Main Subjects

Library Sciences

Abstract AR

في هذا البحث تم استعراض كيفية التعامل مع البيانات الضخمة، إذ إن جمع و تخزين المعلومات و التحليل للبيانات اصبح مسألة لا يمكن السيطرة عليها من خلال برامج معالجة البيانات بأحجامها التقليدية، سابقا كانت واحدة من أكبر العقبات التي تواجه شركات التكنولوجيا و المؤسسات الناشئة و محللي البيانات هي كيفية القدرة على معالجة مثل هذه الأحمال الكبيرة من البيانات و التي كانت عائقا كبيرا للعديد من الشركات الناشئة أو المؤسسات البحثية غير الربحية، لكن البرامج الحديثة مفتوحة المصدر مثل Hadoop و غيره أزالت هذه الحواجز، Hadoop هو منصة أو إطار عمل برمجي يسمح بتخزين و معالجة البيانات على نطاق واسع، و هو مجاني و متاح لجميع المبرمجين و المطورين.

يهدف البحث الى تحديد كيفية التعامل مع مجموعة من البيانات التي يتجاوز حجمها قدرة برامج قواعد البيانات المعروفة لالتقاطها و تخزينها و إدارتها و تحليلها و الذي يتطلب أشكالا مبتكرة و فعالة لمعالجتها تختلف عن معالجة البيانات العادية بحيث تمكن مستخدميها من تحسين الرؤيا و اتخاذ القرارات.

عينة البحث هي الرسائل و الاطاريح الجامعية المتاحة بشكل رقمي بصيغة PDF و بصيغة Word و المتوفرة في المكتبة المركزية للجامعة المستنصرية، و قد بلغت (107345) رسالة و أطروحة جامعية تمثل ٢،٤٩ تيرا بايت مقابل ٢٥٦٦١ كتابا إلكترونيا مخزنة في هذه المكتبة، و تمثل 5٨٥٢ ميغا بنصها الكامل، و بهذا بلغ العدد الإجمالي للبيانات المؤرشفة 3.08 تيرابايت.

و على الرغم من تنوع قواعد البيانات بين مكتبات الجامعة المختلفة، لكن السمة الغالبة في البحث هي حسب الموضوع أو المؤلف أو العنوان.

و يتم استخدام طريقة البحث هذه في معظم أنواع قواعد البيانات المكتبية، و من خلال عدة معايير منها الوقت و الدقة و حجم المصادر التي يتم استدعاؤها في وقت واحد توصلت الباحثة في نتائج بحثها بان الوضع الحالي غير مرضي و ربما يستمر كذلك في المستقبل بسبب التزايد المستمر في أعداد وأ حجام الرسائل و الاطاريح الجامعية و ما يقابله من تنافس قوي من قبل البحوث العلمية إذ اصبح الباحثين يتوجهون لها في الوقت الحاضر و مع تعقيدات الوصول إلى المعلومات الكاملة لمحتوى تلك الرسائل و الاطاريح و عدم إتاحتها بالنص الكامل في اغلب قواعد البيانات وذلك بسبب عدم استخدام التقنيات الملائمة للتعامل مع البيانات الضخمة و استيعاب هذا الكم من البيانات فهذا يعني تردي الطلب على الاطاريح الجامعية قياسا بتزايد قوة الطلب على البحوث العلمية بسبب تعقيدات الوصول لمحتوياتها بالنص الكامل و عدم ملاءمة استراتيجيات البحث التقليدية لمواكبة احتياجات المستفيدين خاصة مع تزايد إتاحة الكتب بشكل رقمي رغم وجود بعض المحددات للوصول الى المحتوى الرقمي الكامل للكتب الرقمية.

أوصت الباحثة انه من الضروري استخدام تقنيات تستجيب لاستراتيجيات البحث خاصة في البيانات الضخمة و البحث المتقدم عبر استخدام برنامج Hadoop لتغطية المخرجات الفكرية في المستقبل، و إمكانية استثمار Hadoop في مجال البيانات الضخمة و اختيار المكتبة المركزية في الجامعة المستنصرية نموذجا للتعامل مع البيانات الضخمة و كيف يمكن إن تساهم في تنظيمها.

Abstract EN

Big data, defined in this paper as the gathering and storage of information and analysis on a scale typically untenable for traditional, mass-market data-processing software, has previously been one of the biggest obstacles facing tech companies, startups, and analytic researchers.

the ability to process such large data loads has been a significant barrier of entry to the market for many young companies or not for profit research organization, but recent open-source software, such as hadoop, have removed those barriers.

hadoop, a programming framework that allows for large-scale data storage and processing, is free and available to all developers.

this software allows independent developers.

the exceeds size ewhos data of set a with deal to how determine to aims research the which analyze, and manage store, capture, to programs database known-well of ability data ordinary from differ that processing of forms effective and innovative requires research the making-decision and vision improve can users its that so processing in digitally available theses and theses university is samplepdf and word and format (vt) to amounted, university mustansiriya-al of library central the in available this in stored ooksb-e o to compared terabytes, *, representing thesis, and theses of number total the thus and, text full its in megabytes a representing and library, the between databases of diversity the despite terabytes t,a reached data archived author subject, by is esearchr the in feature dominant the libraries, university different through and, databases library of types most in used is method research this title, or at called are that sources the of size the and accuracy, time, including criteria, several from competition strong corresponding the and theses and theses university.

time one the with and time present the at them to turning are researchers as research, scientific and theses and theses these of content the for information full accessing of complexities techniques appropriate of lack the to due databases stmo in text full in available being not in deterioration a means this data, of amount the this absorb and data large with deal to scientific for demand increasing the to compared theses, university for demand the the and text full the in contents its accessing of tiescomplexi the to due research the of needs the with pace keep to strategies research traditional of inadequacy the despite digital, in books of availability increasing the with especially beneficiaries, the digital.

books of content digital full the access to slimitation some of presence search to respond that techniques use to necessary is it that recommended researcher using by research, advanced and data big in especially strategies, hadoop program to the in investing hadoop of possibility the and future, the in outputs intellectual cover a is university mustansiriya-al at library central the choosing and data big of field it organizing to contribute can it how and data big with dealing for model.

American Psychological Association (APA)

Salman, Zaynab Abd al-Wahid. 2022. Big data : how the open-source software will open the doors for innovation in libraries. al-Mustansiriya Journal of Arts،Vol. 46, no. 100, pp.23-43.
https://search.emarefa.net/detail/BIM-1495625

Modern Language Association (MLA)

Salman, Zaynab Abd al-Wahid. Big data : how the open-source software will open the doors for innovation in libraries. al-Mustansiriya Journal of Arts Vol. 46, no. 100 (Dec. 2022), pp.23-43.
https://search.emarefa.net/detail/BIM-1495625

American Medical Association (AMA)

Salman, Zaynab Abd al-Wahid. Big data : how the open-source software will open the doors for innovation in libraries. al-Mustansiriya Journal of Arts. 2022. Vol. 46, no. 100, pp.23-43.
https://search.emarefa.net/detail/BIM-1495625

Data Type

Journal Articles

Language

English

Notes

Includes bibliographical references : p. 42-43

Record ID

BIM-1495625