Machine learningDeep learning / NLP / CV

Aprenentatge per transferència amb LSTM

L'aprenentatge per transferència amb LSTM és una tècnica en la qual una xarxa de memòria a llarg termini (Long Short-Term Memory) es pre-entrena primer en un gran corpus o tasca font, i després els seus pesos apresos es transfereixen i s'ajusten finament en una tasca objectiu més petita. Aquest enfocament, popularitzat per ULMFiT (Howard & Ruder, 2018), permet que els models basats en LSTM assoleixin un rendiment sòlid fins i tot quan les dades objectiu etiquetades són escasses.

Obre a MethodMindAviatVídeoAviatDownload slides

Llegeix el mètode complet

Només per a membres

Inicia la sessió amb un compte gratuït per llegir aquesta secció.

Inicia la sessió

Method map

The neighbourhood of related methods — select a node to explore.

Fonts

  1. Howard, J. & Ruder, S. (2018). Universal Language Model Fine-Tuning for Text Classification. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL), 328–339. DOI: 10.18653/v1/P18-1031
  2. Transfer learning. Wikipedia. link

Com citar aquesta pàgina

ScholarGate. (2026, June 3). Transfer Learning with Long Short-Term Memory Networks. ScholarGate. https://scholargate.app/ca/deep-learning/transfer-learning-with-lstm

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citat per

ScholarGateTransfer Learning with LSTM (Transfer Learning with Long Short-Term Memory Networks). Recuperat el 2026-06-15 de https://scholargate.app/ca/deep-learning/transfer-learning-with-lstm · Conjunt de dades: https://doi.org/10.5281/zenodo.20539026