ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Domæne-adaptiv Vision Transformer

Domæne-adaptiv Vision Transformer (DA-ViT) anvender domæneadaptationsteknikker — såsom adversariel alignment, selftræning eller opmærksomhedsniveau-brobygning — oven på en forhåndstrænet Vision Transformer-rygrad for at overføre visuel viden fra et mærket kildedomæne til et umærket eller let mærket måldomæne, hvilket reducerer distributionsskiftet, der begrænser standard ViT finjustering.

Åbn i MethodMindSnartVideoSnartHent slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Metodekort

Nabolaget af beslægtede metoder — vælg en knude for at udforske.

Kilder

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link
  2. Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link

Sådan citerer du denne side

ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/da/deep-learning/domain-adaptive-vision-transformer

Hvilken metode?

Stil denne metode ved siden af dens nærmeste slægtninge, og læs dem side om side — biblioteket lægger bøgerne på bordet; valget er dit.

Sammenlign side om side

Refereret af

ScholarGateDomain-adaptive vision transformer (Domain-Adaptive Vision Transformer (DA-ViT)). Hentet 2026-06-15 fra https://scholargate.app/da/deep-learning/domain-adaptive-vision-transformer · Datasæt: https://doi.org/10.5281/zenodo.20539026