Machine learningDeep learning / NLP / CV

Daudzmodālais LSTM

Daudzmodālais LSTM (Multimodal LSTM) paplašina standarta tīklu Long Short-Term Memory (LSTM), lai vienotā rekurentā arhitektūrā kopīgi apstrādātu secīgus datus no vairākām ievades modalitātēm — piemēram, tekstu, audio un video. Sapludinot attēlojumus no dažādiem avotiem pirms LSTM šūnām vai to iekšienē, tas uztver temporālās atkarības, kas aptver un šķērso modalitātes, padarot to par pamata pieeju tādām uzdevumām kā sentimenta analīze, video aprakstīšana un afektīvā skaitļošana.

Atvērt MethodMindDrīzumāVideoDrīzumāDownload slides

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Method map

The neighbourhood of related methods — select a node to explore.

Avoti

  1. Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link
  2. Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735

Kā citēt šo lapu

ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/lv/deep-learning/multimodal-lstm

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Uz to atsaucas

ScholarGateMultimodal LSTM (Multimodal Long Short-Term Memory Network). Izgūts 2026-06-15 no https://scholargate.app/lv/deep-learning/multimodal-lstm · Datu kopa: https://doi.org/10.5281/zenodo.20539026