ScholarGate
Asistente
Machine learningDeep learning / NLP / CV

Vision Transformer (ViT) de ajuste fino

Vision Transformer (ViT) de ajuste fino adapta un gran modelo ViT preentrenado — que divide las imágenes en parches de tamaño fijo y los procesa a través de capas de autoatención — a una nueva tarea de clasificación o reconocimiento de imágenes utilizando un conjunto de datos etiquetado relativamente pequeño. Logra una precisión de vanguardia en visión por computadora al aprovechar las ricas representaciones aprendidas durante el preentrenamiento a gran escala.

Abrir en MethodMindPróximamenteVídeoPróximamenteDescargar diapositivas

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Mapa de métodos

El vecindario de métodos relacionados: selecciona un nodo para explorarlo.

+4 más

Fuentes

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

Cómo citar esta página

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/es/deep-learning/fine-tuned-vision-transformer

¿Qué método?

Coloca este método junto a sus parientes más cercanos y léelos lado a lado: la biblioteca pone los libros sobre la mesa; la elección es tuya.

Comparar lado a lado

Citado por

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). Recuperado el 2026-06-15 de https://scholargate.app/es/deep-learning/fine-tuned-vision-transformer · Conjunto de datos: https://doi.org/10.5281/zenodo.20539026