Automatic Image Captioning Based on ResNet50 and LSTM with Soft Attention
المؤلفون المشاركون
Yu, Lei
Chu, Yan
Yue, Xiao
Sergei, Mikhailov
Wang, Zhengkui
المصدر
Wireless Communications and Mobile Computing
العدد
المجلد 2020، العدد 2020 (31 ديسمبر/كانون الأول 2020)، ص ص. 1-7، 7ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2020-10-21
دولة النشر
مصر
عدد الصفحات
7
التخصصات الرئيسية
تكنولوجيا المعلومات وعلم الحاسوب
الملخص EN
Captioning the images with proper descriptions automatically has become an interesting and challenging problem.
In this paper, we present one joint model AICRL, which is able to conduct the automatic image captioning based on ResNet50 and LSTM with soft attention.
AICRL consists of one encoder and one decoder.
The encoder adopts ResNet50 based on the convolutional neural network, which creates an extensive representation of the given image by embedding it into a fixed length vector.
The decoder is designed with LSTM, a recurrent neural network and a soft attention mechanism, to selectively focus the attention over certain parts of an image to predict the next sentence.
We have trained AICRL over a big dataset MS COCO 2014 to maximize the likelihood of the target description sentence given the training images and evaluated it in various metrics like BLEU, METEROR, and CIDEr.
Our experimental results indicate that AICRL is effective in generating captions for the images.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Chu, Yan& Yue, Xiao& Yu, Lei& Sergei, Mikhailov& Wang, Zhengkui. 2020. Automatic Image Captioning Based on ResNet50 and LSTM with Soft Attention. Wireless Communications and Mobile Computing،Vol. 2020, no. 2020, pp.1-7.
https://search.emarefa.net/detail/BIM-1214956
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Chu, Yan…[et al.]. Automatic Image Captioning Based on ResNet50 and LSTM with Soft Attention. Wireless Communications and Mobile Computing No. 2020 (2020), pp.1-7.
https://search.emarefa.net/detail/BIM-1214956
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Chu, Yan& Yue, Xiao& Yu, Lei& Sergei, Mikhailov& Wang, Zhengkui. Automatic Image Captioning Based on ResNet50 and LSTM with Soft Attention. Wireless Communications and Mobile Computing. 2020. Vol. 2020, no. 2020, pp.1-7.
https://search.emarefa.net/detail/BIM-1214956
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1214956
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر