Vision Transformer adaptatif au domaine
Le Vision Transformer adaptatif au domaine (DA-ViT) applique des techniques d'adaptation de domaine — telles que l'alignement contradictoire, l'auto-apprentissage ou le pontage au niveau de l'attention — par-dessus une architecture Vision Transformer pré-entraînée pour transférer les connaissances visuelles d'un domaine source étiqueté vers un domaine cible non étiqueté ou faiblement étiqueté, réduisant ainsi le décalage de distribution qui limite le réglage fin standard des ViT.
Lire la méthode complète
Connectez-vous avec un compte gratuit pour lire cette section.
Carte des méthodes
Le voisinage des méthodes apparentées — sélectionnez un nœud pour explorer.
Sources
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Comment citer cette page
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/fr/deep-learning/domain-adaptive-vision-transformer
Quelle méthode ?
Placez cette méthode aux côtés de ses plus proches parentes et lisez-les côte à côte — la bibliothèque pose les ouvrages sur la table ; le choix vous revient.
- Classification basée sur BERT et adaptée au domaineApprentissage profond↔ comparer
- Réseau neuronal convolutif adaptatif au domaineApprentissage profond↔ comparer
- Transformeur Vision AjustéApprentissage profond↔ comparer
- Segmentation sémantiqueApprentissage profond↔ comparer
- Vision TransformerApprentissage profond↔ comparer
Référencée par
Une erreur sur cette page ? Signalez-la ou proposez une correction →