ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodaalne rekurrentne närvivõrk

Multimodaalne rekurrentne närvivõrk ühendab kahe või enama andmemooduse — nagu pildid, tekst ja heli — sisendid rekurrentsesse järjestustöötlusraamistikku. See kodeerib iga mooduse eraldi, ühendab representatsioonid ja töötleb seejärel kombineeritud signaali rekurrentsete üksuste (RNN, LSTM või GRU) kaudu järjestikuste väljundite genereerimiseks või klassifitseerimiseks. See disain tegi sellest alusliku lähenemisviisi piltide kirjeldamisel, videote kirjeldamisel ja audiovisuaalsel kõne tuvastamisel.

Ava rakenduses MethodMindPeagiVideoPeagiDownload slides

Loe meetodi täielikku kirjeldust

Ainult liikmetele

Selle osa lugemiseks logi sisse tasuta kontoga.

Logi sisse

Method map

The neighbourhood of related methods — select a node to explore.

Allikad

  1. Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link

Kuidas sellele lehele viidata

ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/et/deep-learning/multimodal-recurrent-neural-network

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Sellele viitavad

ScholarGateMultimodal Recurrent Neural Network (Multimodal Recurrent Neural Network (MM-RNN)). Loetud 2026-06-15 aadressilt https://scholargate.app/et/deep-learning/multimodal-recurrent-neural-network · Andmestik: https://doi.org/10.5281/zenodo.20539026