Machine learningDeep learning / NLP / CV

Multimodales Rekurrentes Neuronales Netz

Ein multimodales Rekurrentes Neuronales Netz (Multimodal Recurrent Neural Network) kombiniert Eingaben aus zwei oder mehr Datenmodalitäten – wie Bildern, Text und Audio – innerhalb eines rekurrenten Sequenzverarbeitungsrahmens. Es kodiert jede Modalität separat, fusioniert die Repräsentationen und verarbeitet dann das kombinierte Signal durch rekurrente Einheiten (RNN, LSTM oder GRU), um sequentielle Ausgaben zu generieren oder zu klassifizieren. Dieses Design machte es zu einem grundlegenden Ansatz in der Bildunterschriftengenerierung (image captioning), Videobeschreibung und audiovisuellen Spracherkennung.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Multimodales Rekurrentes Neuronales Netz

Gated Recurrent Unit (GR…Long Short-Term Memory (…Multimodale BERT-basiert…Multimodaler Convolution…Multimodaler Transformer Rekurrentes neuronales N…Multimodales GRU

Quellen

Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935 ↗
Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/de/deep-learning/multimodal-recurrent-neural-network

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Gated Recurrent Unit (GRU)Deep Learning↔ compare
Long Short-Term Memory (LSTM)Deep Learning↔ compare
Multimodale BERT-basierte KlassifikationDeep Learning↔ compare
Multimodaler Convolutional Neural NetworkDeep Learning↔ compare
Multimodaler TransformerDeep Learning↔ compare
Rekurrentes neuronales NetzDeep Learning↔ compare

Compare side by side →

Referenziert von

Multimodaler Convolutional Neural Network Multimodales GRU

Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →