Adaptacyjny Wizualny Transformer
Adaptacyjny Wizualny Transformer (DA-ViT) stosuje techniki adaptacji domenowej — takie jak wyrównanie adwersarialne, samo-uczenie się lub mostkowanie na poziomie uwagi — na bazie wstępnie wytrenowanego szkieletu Wizualnego Transformera, aby przenieść wiedzę wizualną z oznaczonej domeny źródłowej do nieoznaczonej lub słabo oznaczonej domeny docelowej, redukując przesunięcie dystrybucji, które ogranicza standardowe dostrajanie ViT.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., ... & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR). link ↗
- Yang, L., Balaji, Y., Lim, S. N., & Shrivastava, A. (2023). TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 520-530. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 3). Domain-Adaptive Vision Transformer (DA-ViT). ScholarGate. https://scholargate.app/pl/deep-learning/domain-adaptive-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Klasyfikacja oparta na domenowo adaptowanym modelu BERTUczenie głębokie↔ compare
- Konwolucyjna sieć neuronowa adaptacyjna do dziedzinyUczenie głębokie↔ compare
- Dostrojony Vision TransformerUczenie głębokie↔ compare
- Segmentacja semantycznaUczenie głębokie↔ compare
- Vision TransformerUczenie głębokie↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →