Machine learningDeep learning / NLP / CV

LSTM Multimodale

L'LSTM Multimodale estende la rete standard Long Short-Term Memory per elaborare congiuntamente dati sequenziali da più modalità di input — come testo, audio e video — all'interno di un'architettura ricorrente unificata. Fondendo le rappresentazioni da diverse sorgenti prima o all'interno delle celle LSTM, cattura dipendenze temporali che attraversano e intersecano le modalità, rendendola un approccio fondamentale per compiti come l'analisi del sentiment, la generazione di didascalie per video e il calcolo affettivo.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

LSTM Multimodale

Meccanismo di Attenzione Unità Ricorrente con Gat…LSTM Transformer Multimodale Multimodal GRU

Fonti

Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link ↗
Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735 ↗

Come citare questa pagina

ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/it/deep-learning/multimodal-lstm

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Meccanismo di AttenzioneApprendimento profondo↔ compare
Unità Ricorrente con Gate (GRU)Apprendimento profondo↔ compare
LSTMApprendimento profondo↔ compare
Transformer MultimodaleApprendimento profondo↔ compare

Compare side by side →

Citato da

Multimodal GRU

Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →