Multimodal LSTM
Multimodal LSTM laiendab standardset Long Short-Term Memory (LSTM) võrku, et töödelda ühtses rekurentses arhitektuuris samaaegselt mitmest sisendimodalitydest – nagu tekst, heli ja video – pärinevat järjestikust andmestikku. Erinevate allikate representatsioonide ühendamine enne LSTM-i rakkudesse või nende sees võimaldab jäädvustada ajas muutuvate sõltuvusi, mis ulatuvad ja ristuvad erinevate modaliteetide vahel, muutes selle fundamentaalseks lähenemisviisiks selliste ülesannete puhul nagu tundeanalüüs, video kirjeldamine ja afektiivne arvutus.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Method map
The neighbourhood of related methods — select a node to explore.
Allikad
- Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link ↗
- Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735 ↗
Kuidas sellele lehele viidata
ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/et/deep-learning/multimodal-lstm
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Tähelepanu mehhanismSüvaõpe↔ compare
- Gated Recurrent Unit (GRU)Süvaõpe↔ compare
- LSTMSüvaõpe↔ compare
- Multimodaalne TransformerSüvaõpe↔ compare
Sellele viitavad
Märkasid sellel lehel viga? Teata sellest või paku parandust →