Domänadaptiv Vision Transformer
Domänadaptiv Vision Transformer (DA-ViT) tillämpar tekniker för domänanpassning – såsom adversariell anpassning, självlärning eller anpassning på uppmärksamhetsnivå – ovanpå en förtränad Vision Transformer-ryggrad för att överföra visuell kunskap från en märkt källdomän till en omärkt eller lätt märkt måldomän, vilket minskar distributionsförskjutningen som begränsar standard ViT-finjustering.
Läs hela metoden
Logga in med ett kostnadsfritt konto för att läsa avsnittet.
Metodkarta
Närområdet av besläktade metoder — välj en nod för att utforska.
Källor
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Så citerar du den här sidan
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/sv/deep-learning/domain-adaptive-vision-transformer
Vilken metod?
Placera den här metoden bredvid sina närmaste släktingar och läs dem sida vid sida — biblioteket lägger fram böckerna på bordet; valet är ditt.
- Domänadaptiv BERT-baserad klassificeringDjupinlärning↔ jämför
- Domänadaptiv faltningsnätverk (Convolutional Neural Network, CNN)Djupinlärning↔ jämför
- Finjusterad Vision TransformerDjupinlärning↔ jämför
- Semantisk segmenteringDjupinlärning↔ jämför
- Vision TransformerDjupinlärning↔ jämför
Refereras av
Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →