Višemodalna rekurentna neuronska mreža
Višemodalna rekurentna neuronska mreža kombinira ulaze iz dviju ili više modalnosti podataka — poput slika, teksta i zvuka — unutar rekurentnog okvira za obradu sekvenci. Ona kodira svaku modalnost zasebno, spaja reprezentacije, a zatim obrađuje kombinirani signal putem rekurentnih jedinica (RNN, LSTM ili GRU) kako bi generirala ili klasificirala sekvencijalne izlaze. Ovaj dizajn učinio ju je temeljnim pristupom u opisivanju slika, opisivanju videozapisa i audio-vizualnom prepoznavanju govora.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Karta metoda
Okruženje srodnih metoda — odaberite čvor za istraživanje.
Izvori
- Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935 ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/hr/deep-learning/multimodal-recurrent-neural-network
Koja metoda?
Postavite ovu metodu uz njoj najsrodnije i pročitajte ih jednu uz drugu — knjižnica vam knjige stavlja na stol; izbor je na vama.
- Gated Recurrent Unit (GRU)Duboko učenje↔ usporedi
- Dugo kratkoročno pamćenje (LSTM)Duboko učenje↔ usporedi
- Multimodalna klasifikacija utemeljena na BERT-uDuboko učenje↔ usporedi
- Multimodalna konvolucijska neuronska mrežaDuboko učenje↔ usporedi
- Multimodalni TransformerDuboko učenje↔ usporedi
- Rekurentna neuronska mrežaDuboko učenje↔ usporedi
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →