Vision Transformer Adaptativo al Dominio
El Vision Transformer Adaptativo al Dominio (DA-ViT) aplica técnicas de adaptación de dominio —como alineación adversaria, autoentrenamiento o puente a nivel de atención— sobre una arquitectura base de Vision Transformer preentrenada para transferir conocimiento visual de un dominio fuente etiquetado a un dominio objetivo sin etiquetar o con pocas etiquetas, reduciendo el desplazamiento de distribución que limita el ajuste fino estándar de ViT.
Leer el método completo
Inicia sesión con una cuenta gratuita para leer esta sección.
Mapa de métodos
El vecindario de métodos relacionados: selecciona un nodo para explorarlo.
Fuentes
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Cómo citar esta página
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/es/deep-learning/domain-adaptive-vision-transformer
¿Qué método?
Coloca este método junto a sus parientes más cercanos y léelos lado a lado: la biblioteca pone los libros sobre la mesa; la elección es tuya.
- Clasificación basada en BERT adaptada al dominioAprendizaje profundo↔ comparar
- Red Neuronal Convolucional Adaptativa al DominioAprendizaje profundo↔ comparar
- Vision Transformer (ViT) de ajuste finoAprendizaje profundo↔ comparar
- Segmentación semánticaAprendizaje profundo↔ comparar
- Vision TransformerAprendizaje profundo↔ comparar
Citado por
¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →