ScholarGate
Assistente
Machine learningDeep learning / NLP / CV

LSTM Multimodale

L'LSTM Multimodale estende la rete standard Long Short-Term Memory per elaborare congiuntamente dati sequenziali da più modalità di input — come testo, audio e video — all'interno di un'architettura ricorrente unificata. Fondendo le rappresentazioni da diverse sorgenti prima o all'interno delle celle LSTM, cattura dipendenze temporali che attraversano e intersecano le modalità, rendendola un approccio fondamentale per compiti come l'analisi del sentiment, la generazione di didascalie per video e il calcolo affettivo.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

Fonti

  1. Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link
  2. Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735

Come citare questa pagina

ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/it/deep-learning/multimodal-lstm

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateMultimodal LSTM (Multimodal Long Short-Term Memory Network). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/multimodal-lstm · Insieme di dati: https://doi.org/10.5281/zenodo.20539026