ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodale GRU

Multimodale GRU breidt de Gated Recurrent Unit (GRU) architectuur uit om sequentiële gegevens van meerdere invoermodaliteiten — zoals tekst, audio en videoframes — gezamenlijk te verwerken binnen een enkel recurrent raamwerk. Door modaliteit-specifieke coderingen op het invoer- of hidden-state niveau te fuseren, vangt het temporele afhankelijkheden op over heterogene datastromen en wordt het veel gebruikt in multimodale sentimentanalyse, video-begrip en audio-visuele spraakherkenning.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Proceedings of EMNLP 2014, 1724–1734. link
  2. Zadeh, A., Chen, M., Poria, S., Cambria, E., & Morency, L.-P. (2017). Tensor Fusion Network for Multimodal Sentiment Analysis. Proceedings of EMNLP 2017, 1103–1114. link

Deze pagina citeren

ScholarGate. (2026, June 3). Multimodal Gated Recurrent Unit. ScholarGate. https://scholargate.app/nl/deep-learning/multimodal-gru

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultimodal GRU (Multimodal Gated Recurrent Unit). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/multimodal-gru · Gegevensset: https://doi.org/10.5281/zenodo.20539026