A confidentiality searchable scheme for storing and retrieving data over cloud

Other Title(s)

آلية بحث آمنة لتخزين و استرجاع البيانات على السحابة

Dissertant

Tamraz, Karim Abd al-Aziz Abd al-Muhsin

Thesis advisor

Fatayir, Tamir Sad
Barhum, Tawfiq Sulayman

University

Islamic University

Faculty

Faculty of Information Technology

Department

Information Technology

University Country

Palestine (Gaza Strip)

Degree

Master

Degree Date

2019

Arabic Abstract

تشكل مزايا الحوسبة السحابية الدوافع الأساسية التي تمكن المستخدم من تخزين بياناته والوصول إليها.

تعمل سعة التخزين السحابي على تقليل مقدار حمل مالك البيانات.

على الرغم من العديد من التقنيات التي تم اقتراحها لتخزين و استرجاع البيانات من السحابة، إلا أن مالك البيانات لا يزال يعاني من نقص السرية واستهلاك الوقت.

في هذا العمل، تم اقتراح مخطط جديد لتخزين و استرجاع البيانات لتحقيق سرية البيانات و كفاءة في الوقت.

تم إنشاء برمجية(MMC ) وهي عبارة عن طبقة وسيطة بين العملاء و موفري الخدمات السحابية.

و قمنا باستخدام وحدة لإدارة المفاتيح تستخدم خوارزمية تشفير متماثلة و غير متماثلة لتحقيق كفاءة في الوقت و الحفاظ على سرية البيانات العديد من المستندات النصية ذات احجام مختلفة قد استخدمت في عملية تحميل و تنزيل الملفات لقياس السرية و أداء الوقت.

في عملية التحميل يقوم MMC بتدوير كل صفوف المستند إلى أعمدة ؛ تم يقسم المستند إلى ملفات فرعية عموديا.

و أخيرا، يتم تشفير كل ملف فرعي و تخزينه في تخزين سحابي مختلف يتم تخزين الملفات الفرعية المقسمة طبقا لجدول يحدد موقع كل قسم في عملية التنزيل : يتم استخدام ثلاثة مستويات للأمان، أولا ؛ يتم استخدام خوارزمية غير متماثلة لعملية المصادقة بـ واستعلام المستخدم ثانيا؛ يتم تطبيق خوارزمية HMAC للتحقق من تكامل استعلام المستخدم الثالث ؛ يتم استخدام خوارزمية بين MMC متماثلة لتشفير الملفات المقسمة.

بنيت MMC في سحابة خاصة، لذلك يتم تنفيذ جميع العمليات في مساحة المنطقة التي تسيطر عليها و رصدها.

يتم الحصول على نتائج عملية البحث من خاتل جدول الفهرس، الذي بني في .MMC يتم حساب التشابه بين استعلام المستخدم و المستندات باستخدام قيم TF-DF تظهر النتائج التجريبية أنه في عملية التحميل، تأخذ تقنية التشفير 54% من الوقت اللازم لتنفيذ النهج المقترح تقنية التقسيم تأخذ 4، و تقنية الدوران تأخذ %31% في عملية التنزيل، تستغرق تقنية فك التشفير حوالي 57% من إجمالي الوقت تقنية الدوران تأخذ 29.5، و تجميع التقنية يأخذ 5 %.

تنجم هذه النسب عن متوسط القيم الأربع الإجمالية لاستهلاك الوقت لأحجام مختلفة للملفات أيضا، تم احتساب الوقت اللازم لتحميل الملفات النصية و تنزيلها بدون تشفير التدوير والقمة يستغرق حوالي 11، 8.5% من الوقت اللازم لتنفيذ المخطط المقترح في عملية التحميل وعملية التنزيل على التوالي.

تشير النتائج إلى أن زيادة سرية المستند يحتاج إلى وقت إضافي من ناحية أخرى، تم احتساب وقت البحث باستخدام عدة كلمات مفتاحية.

عند استخدام 94 ميغابايت من ملفات نصية متعددة، يستغرق وقت البحث باستخدام ثلاث كلمات 0.09 ثانية.

English Abstract

The advantages of Cloud computing constitute the substantial motivation for user to store and access their data.

The cloud storage capacity reduces the data owner’s overhead.

In spite of several techniques were proposed for storing and retrieving data from cloud, the data owner still suffers from a lack of confidentiality and time consumption.

In this work, a new scheme is proposed for storing and retrieving data to achieve data confidentiality and time efficiency.

A Middleware Management Control (MMC) is built which is an-intermediary layer between customer and cloud providers.

Key management uses a symmetric algorithm, and an asymmetric algorithm.

This is to achieve time efficiency and data confidentiality respectively.

Several text documents sizes are prepared for downloading and uploading process to measure confidentiality and time performance.

In upload process; MMC rotates each document rows to columns; then, it divides document into sub-files vertically.

Finally, it encrypts each sub-file and stores it into different cloud storage.

The divided sub files are mapping with cloud providers through location table.

In download process; three security levels are used, first; an asymmetric algorithm is used for authentication process between MMC and user query.

Second; HMAC algorithm is implemented to verify the user query integrity.

Third; a symmetric algorithm is used to encrypt the divided files.

MMC is built in private cloud, so all operations are performed in controlled and monitored region space.

The searching process results are obtained through index table, which built in MMC.

The similarity between user query and documents are calculated using TF-IDF values.

The experimental results show that in upload process, encryption technique takes 54% of the time required to implement the proposed approach.

Dividing technique takes 4%, and rotation technique takes 31%.

In download process, decryption technique takes about 57% of the total time.

Rotation technique takes 29.5%, and assembles technique takes 5%.

These ratios are result from the average of total four values of time consumption for different file sizes.

Also, the time required for upload and download text files without encryption, rotation and dividing are calculated.

It takes about 11%, 8.5% of the time required to implement the proposed scheme in upload process and download process respectively.

The results indicate that increasing document confidentiality needs extra time.

On the other hand, the search time using multiple keywords is calculated.

When 94 MB of several text files are used, then the search time for three keywords takes 0.09 second

Main Subjects

Information Technology and Computer Science

Topics

No. of Pages

57

Table of Contents

Table of contents.

Abstract.

Abstract in Arabic.

Chapter One : Introduction.

Chapter Two : Literature review.

Chapter Three : Methodology.

Chapter Four : Results and discussion

Chapter Five : Conclusion and future work.

References.

American Psychological Association (APA)

Tamraz, Karim Abd al-Aziz Abd al-Muhsin. (2019). A confidentiality searchable scheme for storing and retrieving data over cloud. (Master's theses Theses and Dissertations Master). Islamic University, Palestine (Gaza Strip)
https://search.emarefa.net/detail/BIM-905431

Modern Language Association (MLA)

Tamraz, Karim Abd al-Aziz Abd al-Muhsin. A confidentiality searchable scheme for storing and retrieving data over cloud. (Master's theses Theses and Dissertations Master). Islamic University. (2019).
https://search.emarefa.net/detail/BIM-905431

American Medical Association (AMA)

Tamraz, Karim Abd al-Aziz Abd al-Muhsin. (2019). A confidentiality searchable scheme for storing and retrieving data over cloud. (Master's theses Theses and Dissertations Master). Islamic University, Palestine (Gaza Strip)
https://search.emarefa.net/detail/BIM-905431

Language

English

Data Type

Arab Theses

Record ID

BIM-905431