Multimodaalne rekurrentne närvivõrk
Multimodaalne rekurrentne närvivõrk ühendab kahe või enama andmemooduse — nagu pildid, tekst ja heli — sisendid rekurrentsesse järjestustöötlusraamistikku. See kodeerib iga mooduse eraldi, ühendab representatsioonid ja töötleb seejärel kombineeritud signaali rekurrentsete üksuste (RNN, LSTM või GRU) kaudu järjestikuste väljundite genereerimiseks või klassifitseerimiseks. See disain tegi sellest alusliku lähenemisviisi piltide kirjeldamisel, videote kirjeldamisel ja audiovisuaalsel kõne tuvastamisel.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Method map
The neighbourhood of related methods — select a node to explore.
Allikad
- Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935 ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link ↗
Kuidas sellele lehele viidata
ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/et/deep-learning/multimodal-recurrent-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Gated Recurrent Unit (GRU)Süvaõpe↔ compare
- Long Short-Term Memory (LSTM)Süvaõpe↔ compare
- Mitmemodaalne BERT-põhine klassifitseerimineSüvaõpe↔ compare
- Multimodaalne konvolutsiooniline närvivõrkSüvaõpe↔ compare
- Multimodaalne TransformerSüvaõpe↔ compare
- Korduv närvivõrkSüvaõpe↔ compare
Sellele viitavad
Märkasid sellel lehel viga? Teata sellest või paku parandust →