Дообученный Трансформер
Дообучение Трансформера адаптирует большую предварительно обученную модель — такую как BERT, GPT или ViT — для конкретной последующей задачи путем продолжения градиентного обучения на размеченном целевом наборе данных. Эта двухэтапная парадигма (предварительное обучение, затем дообучение) последовательно достигает наилучших результатов в задачах обработки естественного языка и компьютерного зрения с гораздо меньшим количеством данных, специфичных для задачи, чем обучение с нуля.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Карта метода
Окружение родственных методов — выберите узел, чтобы перейти к нему.
+ ещё 4
Источники
- Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30. link ↗
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. Proceedings of NAACL-HLT 2019, 4171–4186. link ↗
Как цитировать эту страницу
ScholarGate. (2026, June 3). Fine-Tuned Transformer (Task-Specific Adaptation of Pre-Trained Transformer Models). ScholarGate. https://scholargate.app/ru/deep-learning/fine-tuned-transformer
Какой метод?
Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.
- Классификация на основе BERTГлубокое обучение↔ сравнить
- Дообученная классификация на основе BERTГлубокое обучение↔ сравнить
- Дообученная рекуррентная нейронная сетьГлубокое обучение↔ сравнить
- Классификация на основе RoBERTaГлубокое обучение↔ сравнить
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →