Domæne-adaptiv Vision Transformer
Domæne-adaptiv Vision Transformer (DA-ViT) anvender domæneadaptationsteknikker — såsom adversariel alignment, selftræning eller opmærksomhedsniveau-brobygning — oven på en forhåndstrænet Vision Transformer-rygrad for at overføre visuel viden fra et mærket kildedomæne til et umærket eller let mærket måldomæne, hvilket reducerer distributionsskiftet, der begrænser standard ViT finjustering.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Metodekort
Nabolaget af beslægtede metoder — vælg en knude for at udforske.
Kilder
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/da/deep-learning/domain-adaptive-vision-transformer
Hvilken metode?
Stil denne metode ved siden af dens nærmeste slægtninge, og læs dem side om side — biblioteket lægger bøgerne på bordet; valget er dit.
- Domæne-adaptiv BERT-baseret klassifikationDyb læring↔ sammenlign
- Domæne-adaptivt Konvolutionelt Neuralt NetværkDyb læring↔ sammenlign
- Finetunet Vision TransformerDyb læring↔ sammenlign
- Semantisk segmenteringDyb læring↔ sammenlign
- Vision TransformerDyb læring↔ sammenlign
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →