Трансферно обучение с LSTM
Трансферното обучение с LSTM е техника, при която мрежа с дълга краткосрочна памет (Long Short-Term Memory, LSTM) първоначално се обучава предварително върху голям изходен корпус или задача, след което научените ѝ тегла се прехвърлят и донастройват за по-малка целева задача. Този подход, популяризиран от ULMFiT (Howard & Ruder, 2018), позволява на модели, базирани на LSTM, да постигнат висока производителност дори когато етикетираните целеви данни са оскъдни.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Карта на методите
Обкръжението на сродните методи — изберете възел, за да го разгледате.
Източници
- Howard, J. & Ruder, S. (2018). Universal Language Model Fine-Tuning for Text Classification. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL), 328–339. DOI: 10.18653/v1/P18-1031 ↗
- Transfer learning. Wikipedia. link ↗
Как да цитирате тази страница
ScholarGate. (2026, June 3). Transfer Learning with Long Short-Term Memory Networks. ScholarGate. https://scholargate.app/bg/deep-learning/transfer-learning-with-lstm
Кой метод?
Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.
- Класификация, базирана на BERTДълбоко обучение↔ сравняване
- Фино настроен LSTMДълбоко обучение↔ сравняване
- Вентилна рекурентна единица (GRU)Дълбоко обучение↔ сравняване
- Дългосрочна краткосрочна памет (LSTM)Дълбоко обучение↔ сравняване
- Трансферно обучение с рекурентна невронна мрежаДълбоко обучение↔ сравняване
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →