Адаптивный к домену Vision Transformer
Адаптивный к домену Vision Transformer (DA-ViT) применяет методы адаптации домена — такие как сопоставление с помощью состязательности (adversarial alignment), самообучение (self-training) или выравнивание на уровне внимания (attention-level bridging) — поверх предварительно обученной основы Vision Transformer для переноса визуальных знаний из размеченного исходного домена в неразмеченный или слабо размеченный целевой домен, уменьшая сдвиг распределения, который ограничивает стандартную дообучение (fine-tuning) ViT.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Карта метода
Окружение родственных методов — выберите узел, чтобы перейти к нему.
Источники
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Как цитировать эту страницу
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/ru/deep-learning/domain-adaptive-vision-transformer
Какой метод?
Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.
- Адаптация BERT-модели к домену на основе классификацииГлубокое обучение↔ сравнить
- Адаптивная к домену сверточная нейронная сетьГлубокое обучение↔ сравнить
- Дообученный Vision TransformerГлубокое обучение↔ сравнить
- Семантическая сегментацияГлубокое обучение↔ сравнить
- Vision TransformerГлубокое обучение↔ сравнить
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →