ScholarGate
Asistent
Machine learningDeep learning / NLP / CV

Višemodalna rekurentna neuronska mreža

Višemodalna rekurentna neuronska mreža kombinira ulaze iz dviju ili više modalnosti podataka — poput slika, teksta i zvuka — unutar rekurentnog okvira za obradu sekvenci. Ona kodira svaku modalnost zasebno, spaja reprezentacije, a zatim obrađuje kombinirani signal putem rekurentnih jedinica (RNN, LSTM ili GRU) kako bi generirala ili klasificirala sekvencijalne izlaze. Ovaj dizajn učinio ju je temeljnim pristupom u opisivanju slika, opisivanju videozapisa i audio-vizualnom prepoznavanju govora.

Otvorite u MethodMindUskoroVideoUskoroPreuzmi prezentaciju

Pročitajte cijelu metodu

Samo za članove

Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.

Prijavite se

Karta metoda

Okruženje srodnih metoda — odaberite čvor za istraživanje.

Izvori

  1. Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link

Kako citirati ovu stranicu

ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/hr/deep-learning/multimodal-recurrent-neural-network

Koja metoda?

Postavite ovu metodu uz njoj najsrodnije i pročitajte ih jednu uz drugu — knjižnica vam knjige stavlja na stol; izbor je na vama.

Usporedi jedno uz drugo

Citirana u

ScholarGateMultimodal Recurrent Neural Network (Multimodal Recurrent Neural Network (MM-RNN)). Preuzeto 2026-06-15 s https://scholargate.app/hr/deep-learning/multimodal-recurrent-neural-network · Skup podataka: https://doi.org/10.5281/zenodo.20539026