Machine learningDeep learning / NLP / CV

گیتد بازگشتی چندوجهی

گیتد بازگشتی چندوجهی (Multimodal GRU) معماری گیتد بازگشتی (GRU) را گسترش می‌دهد تا داده‌های ترتیبی را از چندین وجه ورودی - مانند متن، صدا و فریم‌های ویدئو - به طور مشترک در یک چارچوب بازگشتی واحد پردازش کند. با ادغام رمزگذاری‌های خاص وجه در سطح ورودی یا حالت پنهان، وابستگی‌های زمانی را در سراسر جریان‌های داده ناهمگن ثبت می‌کند و به طور گسترده در تحلیل احساسات چندوجهی، درک ویدئو و تشخیص گفتار صوتی-تصویری استفاده می‌شود.

باز کردن در MethodMindبه‌زودیویدیوبه‌زودیDownload slides

مطالعهٔ کامل روش

ویژهٔ اعضا

برای خواندن این بخش با حساب رایگان وارد شوید.

ورود

Method map

The neighbourhood of related methods — select a node to explore.

گیتد بازگشتی چندوجهی

واحد تکرارشونده گیت‌دار…حافظه طولانی کوتاه‌مدت (…طبقه‌بندی چندوجهی مبتنی…شبکه حافظه طولانی کوتاه…شبکه عصبی بازگشتی چندوجهی ترانسفورمر چندوجهی

منابع

Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Proceedings of EMNLP 2014, 1724–1734. link ↗
Zadeh, A., Chen, M., Poria, S., Cambria, E., & Morency, L.-P. (2017). Tensor Fusion Network for Multimodal Sentiment Analysis. Proceedings of EMNLP 2017, 1103–1114. link ↗

نحوهٔ استناد به این صفحه

ScholarGate. (2026, June 3). Multimodal Gated Recurrent Unit. ScholarGate. https://scholargate.app/fa/deep-learning/multimodal-gru

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

واحد تکرارشونده گیت‌دار (GRU)یادگیری عمیق↔ compare
حافظه طولانی کوتاه‌مدت (LSTM)یادگیری عمیق↔ compare
طبقه‌بندی چندوجهی مبتنی بر BERTیادگیری عمیق↔ compare
شبکه حافظه طولانی کوتاه چندوجهی (Multimodal LSTM)یادگیری عمیق↔ compare
شبکه عصبی بازگشتی چندوجهییادگیری عمیق↔ compare
ترانسفورمر چندوجهییادگیری عمیق↔ compare

Compare side by side →

در این صفحه مشکلی دیدید؟ گزارش دهید یا اصلاحی پیشنهاد کنید →