Multimodale GRU
Multimodale GRU breidt de Gated Recurrent Unit (GRU) architectuur uit om sequentiële gegevens van meerdere invoermodaliteiten — zoals tekst, audio en videoframes — gezamenlijk te verwerken binnen een enkel recurrent raamwerk. Door modaliteit-specifieke coderingen op het invoer- of hidden-state niveau te fuseren, vangt het temporele afhankelijkheden op over heterogene datastromen en wordt het veel gebruikt in multimodale sentimentanalyse, video-begrip en audio-visuele spraakherkenning.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
Bronnen
- Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Proceedings of EMNLP 2014, 1724–1734. link ↗
- Zadeh, A., Chen, M., Poria, S., Cambria, E., & Morency, L.-P. (2017). Tensor Fusion Network for Multimodal Sentiment Analysis. Proceedings of EMNLP 2017, 1103–1114. link ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Multimodal Gated Recurrent Unit. ScholarGate. https://scholargate.app/nl/deep-learning/multimodal-gru
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Gated Recurrent Unit (GRU)Deep learning↔ compare
- Long Short-Term Memory (LSTM)Deep learning↔ compare
- Multimodale BERT-gebaseerde classificatieDeep learning↔ compare
- Multimodale LSTMDeep learning↔ compare
- Multimodaal Recurrent Neural NetworkDeep learning↔ compare
- Multimodale TransformerDeep learning↔ compare
Een fout op deze pagina gezien? Meld het of stel een correctie voor →