Multimodal Feature Learning for Video Captioning
المؤلفون المشاركون
المصدر
Mathematical Problems in Engineering
العدد
المجلد 2018، العدد 2018 (31 ديسمبر/كانون الأول 2018)، ص ص. 1-8، 8ص.
الناشر
Hindawi Publishing Corporation
تاريخ النشر
2018-02-19
دولة النشر
مصر
عدد الصفحات
8
التخصصات الرئيسية
الملخص EN
Video captioning refers to the task of generating a natural language sentence that explains the content of the input video clips.
This study proposes a deep neural network model for effective video captioning.
Apart from visual features, the proposed model learns additionally semantic features that describe the video content effectively.
In our model, visual features of the input video are extracted using convolutional neural networks such as C3D and ResNet, while semantic features are obtained using recurrent neural networks such as LSTM.
In addition, our model includes an attention-based caption generation network to generate the correct natural language captions based on the multimodal video feature sequences.
Various experiments, conducted with the two large benchmark datasets, Microsoft Video Description (MSVD) and Microsoft Research Video-to-Text (MSR-VTT), demonstrate the performance of the proposed model.
نمط استشهاد جمعية علماء النفس الأمريكية (APA)
Lee, Sujin& Kim, Incheol. 2018. Multimodal Feature Learning for Video Captioning. Mathematical Problems in Engineering،Vol. 2018, no. 2018, pp.1-8.
https://search.emarefa.net/detail/BIM-1206682
نمط استشهاد الجمعية الأمريكية للغات الحديثة (MLA)
Lee, Sujin& Kim, Incheol. Multimodal Feature Learning for Video Captioning. Mathematical Problems in Engineering No. 2018 (2018), pp.1-8.
https://search.emarefa.net/detail/BIM-1206682
نمط استشهاد الجمعية الطبية الأمريكية (AMA)
Lee, Sujin& Kim, Incheol. Multimodal Feature Learning for Video Captioning. Mathematical Problems in Engineering. 2018. Vol. 2018, no. 2018, pp.1-8.
https://search.emarefa.net/detail/BIM-1206682
نوع البيانات
مقالات
لغة النص
الإنجليزية
الملاحظات
Includes bibliographical references
رقم السجل
BIM-1206682
قاعدة معامل التأثير والاستشهادات المرجعية العربي "ارسيف Arcif"
أضخم قاعدة بيانات عربية للاستشهادات المرجعية للمجلات العلمية المحكمة الصادرة في العالم العربي
تقوم هذه الخدمة بالتحقق من التشابه أو الانتحال في الأبحاث والمقالات العلمية والأطروحات الجامعية والكتب والأبحاث باللغة العربية، وتحديد درجة التشابه أو أصالة الأعمال البحثية وحماية ملكيتها الفكرية. تعرف اكثر