Réseau neuronal récurrent multimodal
Un réseau neuronal récurrent multimodal combine des entrées provenant de deux modalités de données ou plus — telles que des images, du texte et de l'audio — au sein d'un cadre de traitement séquentiel récurrent. Il encode chaque modalité séparément, fusionne les représentations, puis traite le signal combiné à travers des unités récurrentes (RNN, LSTM ou GRU) pour générer ou classifier des sorties séquentielles. Cette conception en a fait une approche fondamentale dans la génération de légendes d'images, la description vidéo et la reconnaissance de la parole audio-visuelle.
Lire la méthode complète
Connectez-vous avec un compte gratuit pour lire cette section.
Carte des méthodes
Le voisinage des méthodes apparentées — sélectionnez un nœud pour explorer.
Sources
- Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935 ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link ↗
Comment citer cette page
ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/fr/deep-learning/multimodal-recurrent-neural-network
Quelle méthode ?
Placez cette méthode aux côtés de ses plus proches parentes et lisez-les côte à côte — la bibliothèque pose les ouvrages sur la table ; le choix vous revient.
- Unité récurrente "gated" (GRU)Apprentissage profond↔ comparer
- Long Short-Term Memory (LSTM)Apprentissage profond↔ comparer
- Classification multimodale basée sur BERTApprentissage profond↔ comparer
- Réseau de neurones convolutifs multimodauxApprentissage profond↔ comparer
- Transformeur MultimodalApprentissage profond↔ comparer
- Réseau de neurones récurrentApprentissage profond↔ comparer
Référencée par
Une erreur sur cette page ? Signalez-la ou proposez une correction →