ScholarGate
Ассистент
Machine learningDeep learning / NLP / CV

Дообученный Трансформер

Дообучение Трансформера адаптирует большую предварительно обученную модель — такую как BERT, GPT или ViT — для конкретной последующей задачи путем продолжения градиентного обучения на размеченном целевом наборе данных. Эта двухэтапная парадигма (предварительное обучение, затем дообучение) последовательно достигает наилучших результатов в задачах обработки естественного языка и компьютерного зрения с гораздо меньшим количеством данных, специфичных для задачи, чем обучение с нуля.

Открыть в MethodMindСкороВидеоСкороСкачать слайды

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Карта метода

Окружение родственных методов — выберите узел, чтобы перейти к нему.

+ ещё 4

Источники

  1. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30. link
  2. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. Proceedings of NAACL-HLT 2019, 4171–4186. link

Как цитировать эту страницу

ScholarGate. (2026, June 3). Fine-Tuned Transformer (Task-Specific Adaptation of Pre-Trained Transformer Models). ScholarGate. https://scholargate.app/ru/deep-learning/fine-tuned-transformer

Какой метод?

Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.

Сравнить рядом

Упоминается в

ScholarGateFine-Tuned Transformer (Fine-Tuned Transformer (Task-Specific Adaptation of Pre-Trained Transformer Models)). Получено 2026-06-15 из https://scholargate.app/ru/deep-learning/fine-tuned-transformer · Набор данных: https://doi.org/10.5281/zenodo.20539026