Machine learningDeep learning / NLP / CV

Daudzmodālais LSTM

Daudzmodālais LSTM (Multimodal LSTM) paplašina standarta tīklu Long Short-Term Memory (LSTM), lai vienotā rekurentā arhitektūrā kopīgi apstrādātu secīgus datus no vairākām ievades modalitātēm — piemēram, tekstu, audio un video. Sapludinot attēlojumus no dažādiem avotiem pirms LSTM šūnām vai to iekšienē, tas uztver temporālās atkarības, kas aptver un šķērso modalitātes, padarot to par pamata pieeju tādām uzdevumām kā sentimenta analīze, video aprakstīšana un afektīvā skaitļošana.

Atvērt MethodMindDrīzumāVideoDrīzumāDownload slides

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Method map

The neighbourhood of related methods — select a node to explore.

Daudzmodālais LSTM

Attention mechanism Gated Recurrent Unit (GR…ILSM Daudzmodālu Transformers Daudzmodālais GRU

Avoti

Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link ↗
Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735 ↗

Kā citēt šo lapu

ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/lv/deep-learning/multimodal-lstm

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Attention mechanismDziļā mācīšanās↔ compare
Gated Recurrent Unit (GRU)Dziļā mācīšanās↔ compare
ILSMDziļā mācīšanās↔ compare
Daudzmodālu TransformersDziļā mācīšanās↔ compare

Compare side by side →

Uz to atsaucas

Daudzmodālais GRU

Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →