Daudzmodālais LSTM
Daudzmodālais LSTM (Multimodal LSTM) paplašina standarta tīklu Long Short-Term Memory (LSTM), lai vienotā rekurentā arhitektūrā kopīgi apstrādātu secīgus datus no vairākām ievades modalitātēm — piemēram, tekstu, audio un video. Sapludinot attēlojumus no dažādiem avotiem pirms LSTM šūnām vai to iekšienē, tas uztver temporālās atkarības, kas aptver un šķērso modalitātes, padarot to par pamata pieeju tādām uzdevumām kā sentimenta analīze, video aprakstīšana un afektīvā skaitļošana.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Method map
The neighbourhood of related methods — select a node to explore.
Avoti
- Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link ↗
- Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735 ↗
Kā citēt šo lapu
ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/lv/deep-learning/multimodal-lstm
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Attention mechanismDziļā mācīšanās↔ compare
- Gated Recurrent Unit (GRU)Dziļā mācīšanās↔ compare
- ILSMDziļā mācīšanās↔ compare
- Daudzmodālu TransformersDziļā mācīšanās↔ compare
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →