ScholarGate
Assistant
Machine learningDeep learning / NLP / CV

Réseau neuronal récurrent multimodal

Un réseau neuronal récurrent multimodal combine des entrées provenant de deux modalités de données ou plus — telles que des images, du texte et de l'audio — au sein d'un cadre de traitement séquentiel récurrent. Il encode chaque modalité séparément, fusionne les représentations, puis traite le signal combiné à travers des unités récurrentes (RNN, LSTM ou GRU) pour générer ou classifier des sorties séquentielles. Cette conception en a fait une approche fondamentale dans la génération de légendes d'images, la description vidéo et la reconnaissance de la parole audio-visuelle.

Ouvrir dans MethodMindBientôtVidéoBientôtTélécharger les diapositives

Lire la méthode complète

Réservé aux membres

Connectez-vous avec un compte gratuit pour lire cette section.

Se connecter

Carte des méthodes

Le voisinage des méthodes apparentées — sélectionnez un nœud pour explorer.

Sources

  1. Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link

Comment citer cette page

ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/fr/deep-learning/multimodal-recurrent-neural-network

Quelle méthode ?

Placez cette méthode aux côtés de ses plus proches parentes et lisez-les côte à côte — la bibliothèque pose les ouvrages sur la table ; le choix vous revient.

Comparer côte à côte

Référencée par

ScholarGateMultimodal Recurrent Neural Network (Multimodal Recurrent Neural Network (MM-RNN)). Consulté le 2026-06-15 sur https://scholargate.app/fr/deep-learning/multimodal-recurrent-neural-network · Jeu de données : https://doi.org/10.5281/zenodo.20539026